能力说明
能力名称:分类词云统计
功能简介
对不同类别文章的关键词进行统计,并依次存储在指定数据源表内。30s内入再无数据流入或者手动停止能力,则输出统计结果到数据表中,并自动停止能力。
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 关键词字段 | 文本 | 否 | 多个关键词内容,中间以" "分隔 ,如果没有关键词字段,需要能力自动提取,可以不填 | |
| 文章分类字段 | 文本 | 否 | 设置分类字段名 | |
| 标题字段 | 文本 | 否 | 设置标题字段名 | |
| 正文字段 | 文本 | 否 | 设置正文字段名 | |
| 不想要的词 | 文本 | 否 | 设置不需要统计的关键词,以","分隔 | |
| 请配置存储统计结果的数据源连接信息 | 文本 | 是 | 下拉框选择数据源,其中表名可以自动创建 |
输入简介
无
输入数据样例
关键词字段 配置为"feature_words", 文章分类字段配置为"classify"
{
"unique_crc": "1608159186065102736",
"hit_clue": "关键特征=龙舟[*7*]微信群;",
"url_crc": "2991464122075594880",
"data_id": "8501801634431065378",
"feature_words": "龙舟 微信群 ",
"hit_tag": "户外运动场景/水上运动/水上/龙舟/场景/网生场景",
"id": "3",
"keywords_code": "11272147525765",
"classify":"社会"
}
或者,
标题字段配置为"title",正文字段配置为"content"。由能力对文章进行分类和提取关键词
{
"unique_crc": "1608159186065102736",
"hit_clue": "关键特征=龙舟[*7*]微信群;",
"url_crc": "2991464122075594880",
"data_id": "8501801634431065378",
"hit_tag": "户外运动场景/水上运动/水上/龙舟/场景/网生场景",
"id": "3",
"keywords_code": "11272147525765"
"title":"3名航天员在太空整整7周了,“出差”之余不耽误看奥运",
"content":"没错,从6月17日神舟十二号发射成功到今天,聂海胜、刘伯明、汤洪波3名航天员在太空整整7周了。6月17日18时48分,航天员们先后进入天和核心舱,标志着中国人首次进入自己的空间站。"
}
输出简介
输出结果存储在选定的数据源的表内。供词云展示使用。根据类别,会存储多条结果
| ----- | ----- | ----- | ----- | ----- | | classify | content_keywords | | - | - | | 社会 | 词云统计结果(json字符串) | | 财经 | 词云统计结果 (json字符串)| | 军事 | 词云统计结果(json字符串) | | ... | 词云统计结果(json字符串) |
输出数据样例
词云统计结果示例如下:
{
"datas": [
{
"str": "渗透率",
"natureFlag": 8,
"weight": 1
},
{
"str": "产量",
"natureFlag": 32,
"weight": 3
},
{
"str": "教育部",
"natureFlag": 4,
"weight": 9
},
{
"str": "AEB-Cyclist",
"natureFlag": -2130706400,
"weight": 1
},
{
"str": "公司",
"natureFlag": 32,
"weight": 2
},
{
"str": "粮价",
"natureFlag": 32,
"weight": 2
},
{
"str": "采购方",
"natureFlag": 32,
"weight": 1
},
{
"str": "内部",
"natureFlag": 65536,
"weight": 1
}
],
"data_type": "keyword"
}
参考指标
数据质量:90%
处理性能:1400条/s,300条/s
无
附加说明
无
隐藏参数说明
无