能力说明

能力名称:文章分类

功能简介

对文章按照内容类型进行自动分类,为文章聚类、文本内容分析等应用提供基础技术支持。 目前支持的分类类目如下:1、国际 2、体育 3、娱乐 4、社会 5、财经 6、时事 7、科技 8、情感 9、汽车 10、教育 11、时尚 12、游戏 13、军事 14、旅游 15、美食 16、文化 17、健康养生 18、家居 19、动漫 20、母婴育儿 21、星座运势 22、综合。 注:一条数据只打一个分类标签

配置参数

参数名称 参数类型 是否必填 默认值 参数说明
标题对应字段名 文本 fmt_title 标题对应的字段名称
正文对应字段名 文本 fmt_format_content 正文对应的字段名称
分类映射 文本 分类映射
生成字段名称 文本 classify 生成字段名称

输入简介

  • 标题对应字段名:指在数据中,标题对应的字段名称
  • 正文对应字段名:指在数据中,正文对应的字段名称
  • 分类映射:如果自定义分类名称与现有的能力支持的分类不一致,可以通过json配置进行映射。

例如:某用户对于文章分类的定义只有13种,分别为财经,房产,健康,教育,军事,科技,旅游,汽车,社会,时政,体育,文化,娱乐。需要对分类标签做一个映射,以便满足对标签的定义需求。因此,可以设定json配置如下:

{"财经":"财经","房产":"家居","健康":"健康养生","教育":"教育,母婴育儿","军事":"军事","科技":"科技","旅游":"旅游","汽车":"汽车","社会":"社会","时政":"时事","体育":"体育","文化":"文化","娱乐":"娱乐"} 该配置说明了自定义分类标签与现有能力分类标签的对应关系。json格式文件的键对应是用户自定义分类,值对应能力现有分类。对于一对多标签清理,中间以逗号分隔。如:"教育"对应"教育"和"母婴育儿"两个标签。 对于未设定的标签,会打上“其他”。

输入数据样例

{"fmt_title":"今夜,我们与小将同在! 世界杯不能没有你们,一定加油!", "fmt_format_content":"今天凌晨,俄罗斯世界杯的出线名额争夺战已经进入到了最后的白热化阶段。在早先结束的一场非洲区预选赛中,贝纳蒂亚领衔的摩洛哥以2-0的比分击败了劲旅科特迪瓦,时隔20年后,再次拿到了世界杯决赛圈的入场券!而在另外两场欧洲区的附加赛中,大壮和师太各自代表的克罗地亚和瑞士也分别通过两回合比赛击败了对手,成功出线!恭喜三位斑马勇士! 在我们为我们的斑马国脚们圆梦世界杯而感到高兴的同时,蓝衣军团的现状则令人感到担忧。我们的小将、椰子、巴扎、贝贝以及鲁加尼将在明天凌晨,在圣西罗迎来与瑞典的生死之战。而这场比赛的意义,想必对于我们的球迷来说,则更加牵动着我们的心。 两天前,在斯德哥尔摩的那个夜晚,蓝衣军团0-1不敌主场作战的瑞典,这样的结果意味着,回到主场作战的意大利不能拿下本场比赛的胜利,那么蓝衣军团的世界杯之路就将梦碎圣西罗。或许意大利的胜负与否,对我们来说并没有那么重要。但是每当想到39岁的小将,36岁的巴扎和33岁的椰子,有可能会以这样的方式告别世界杯的赛场,我们的心里,又怎会不起波澜? 1997年10月29日,不到20岁的布冯在莫斯科的漫天飞雪中,奉献了自己蓝衣军团的首秀。与如今相似的是,当时摆在意大利面前同样是一场艰巨的世界杯附加赛,初露锋芒的小将没有让整个亚平宁失望,不仅用过硬的表现开启了自己的蓝衣生涯,更是帮助蓝衣军团跨过了那年的附加赛,迈向了98年法国世界杯。20年的轮回,如今的小将再一次和意大利站在了附加赛的门前。这一次,39岁的小将,能否拯救他胸前这枚守护了20年之久的意大利队徽? 因此,尽管今晚与瑞典的比赛并不是尤文的比赛,尽管蓝衣军团的阵中有着来自于不同俱乐部的面孔,但是所有的斑马球迷,一定都希望看到,在明年的俄罗斯世界杯能够出现上图的一幕,坚决的椰子依然守护在小将的身前,为了他们心中的国家荣誉,奋战在世界足球最高水平的舞台上! 因此,请大家与我们一起,为了我们意大利国脚们心中不老的梦,为了小将的最后一届世界杯之旅,在今晚,秉承着我们对一代传奇的敬仰与尊重,为身披蓝衣的他们摇旗呐喊,与他们一同在米兰的圣西罗,战斗到最后一刻!加油!"}

输出简介

输出字段,并打上分类结果标签

输出数据样例

{"classify":"体育"}

相关能力

参考指标

  • 数据质量:95%

  • 处理性能:400条/s

新闻数据400条/s

附加说明

隐藏参数说明

results matching ""

    No results matching ""