能力说明
能力名称:时序词云统计
功能简介
统计时间区间内的关键词结果,并按照时间字段依次存储在指定数据源表内。30s内入再无数据流入或者手动停止能力,则输出统计结果到数据表中,并自动停止能力。
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 关键词字段 | 文本 | 否 | 多个关键词内容,中间以" "分隔 ,如果没有关键词字段,需要能力自动提取,可以不填 | |
| 标题字段 | 文本 | 否 | 设置标题字段名 | |
| 正文字段 | 文本 | 否 | 设置正文字段名 | |
| 时间字段 | 文本 | 否 | 设置时间字段名 | |
| 起始时间 | 文本 | 否 | 设置统计区间开始时间 | |
| 终止时间 | 文本 | 否 | 设置统计区间结束时间 | |
| 时间间隔 | 文本 | 否 | 设置统计时间间隔,支持一小时,一天,一月 | |
| 不想要的词 | 文本 | 否 | 设置不需要统计的关键词,以","分隔 | |
| 请配置存储统计结果的数据源连接信息 | 文本 | 是 | 下拉框选择数据源,其中表名可以自动创建 |
输入简介
无
输入数据样例
起始时间配置为 "2021-08-03",终止时间配置为"2021-08-06",时间间隔为"一天"
关键词字段 配置为"feature_words", 时间字段配置为"release_date"
{
"unique_crc": "1608159186065102736",
"hit_clue": "关键特征=龙舟[*7*]微信群;",
"url_crc": "2991464122075594880",
"data_id": "8501801634431065378",
"feature_words": "龙舟 微信群 ",
"hit_tag": "户外运动场景/水上运动/水上/龙舟/场景/网生场景",
"id": "3",
"keywords_code": "11272147525765",
"release_date":"2021-08-06 00:00:00"
}
或者,
标题字段配置为"title",正文字段配置为"content"。由能力对文章提取关键词
{
"unique_crc": "1608159186065102736",
"hit_clue": "关键特征=龙舟[*7*]微信群;",
"url_crc": "2991464122075594880",
"data_id": "8501801634431065378",
"hit_tag": "户外运动场景/水上运动/水上/龙舟/场景/网生场景",
"id": "3",
"keywords_code": "11272147525765",
"release_date":"2021-08-06 00:00:00"
"title":"3名航天员在太空整整7周了,“出差”之余不耽误看奥运",
"content":"没错,从6月17日神舟十二号发射成功到今天,聂海胜、刘伯明、汤洪波3名航天员在太空整整7周了。6月17日18时48分,航天员们先后进入天和核心舱,标志着中国人首次进入自己的空间站。"
}
输出简介
输出结果存储在选定的数据源的表内。供词云展示使用。根据时间间隔,会存储多条结果
| ----- | ----- | | mydate | content_keywords | | - | - | | 2021-08-03 | 词云统计结果(json字符串) | | 2021-08-04 | 词云统计结果 (json字符串)| | 2021-08-05 | 词云统计结果(json字符串) | | 2021-08-06 | 词云统计结果(json字符串) |
输出数据样例
词云统计结果示例如下:
{
"datas": [
{
"str": "渗透率",
"natureFlag": 8,
"weight": 1
},
{
"str": "产量",
"natureFlag": 32,
"weight": 3
},
{
"str": "教育部",
"natureFlag": 4,
"weight": 9
},
{
"str": "AEB-Cyclist",
"natureFlag": -2130706400,
"weight": 1
},
{
"str": "公司",
"natureFlag": 32,
"weight": 2
},
{
"str": "粮价",
"natureFlag": 32,
"weight": 2
},
{
"str": "采购方",
"natureFlag": 32,
"weight": 1
},
{
"str": "内部",
"natureFlag": 65536,
"weight": 1
}
],
"data_type": "keyword"
}
相关能力
无
参考指标
数据质量:90%
处理性能:1400条/s,300条/s
无
附加说明
无
隐藏参数说明
无