能力说明

能力名称:新闻文章互动数

功能简介

新闻互动数能力可以分别选择一次性采集或周期性采集两种采集方式

(1)选择一次性时,根据新闻链接一次性采集该新闻下的所有互动数

(2)选择周期性时,根据新闻链接按照设置的周期采集该新闻下的互动数数据,48小时之内,根据设置的周期采集,48小时后停止采集

配置参数

参数名称 参数类型 是否必填 默认值 参数说明
任务执行编号 数字 0 0-99任意自然数,能力会根据任务编号来判断是否继续执行上一次任务,数字不变则继续执行,反之则重采
请输入链接 文本 直接部署链接时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在10000以内;当能力接收上层数据流时可不填
选择历史还是实时任务 文本 选择是一次性任务/周期性任务,一次性任务即历史任务,采集一次终止,周期任务即实时任务,即需要设置采集周期,每隔多长时间采集一次
采集频度 数字 240 选择周期性任务时填写采集的频度(即采集周期,单位:分钟),默认240分钟,可下拉列表选择,48小时之内,根据设置的周期采集,48小时后停止采集

输入简介

输入需要采集互动数的新闻链接,多个以回车换行分隔

输入数据样例

http://3g.163.com/news/article/D8A0414V0519ADGM.html
http://www.sohu.com/a/216924310_120000

支持如下两种上游流入格式:

第一种字符串:["http://xxx.xxx.xxx"]
第二种json传:{"url","http://xxx.xxx.xxx"}

输出简介

输出为新闻相对应的新闻互动数数据

输出数据样例

部分输出字段简介:

1.comment_count:评论数

2.click_count:点击数

3.url:主贴链接

输出详细字段信息举例如下:

{
    "partake_count":"199",
    "comment_count":"153",
    "click_count":"199",
    "reidx_uid":"",
    "rel_type":"m",
    "download_date":"2018-01-17 10:42:58",
    "source_type":"0",
    "url":"http://news.ifeng.com/a/20180113/55090988_0.shtml",
    "from_flag":"comment_dpt"
}

相关能力

参考指标

  • 数据质量:准确率:95%

  • 处理性能:100条/min

CPU:4 内存:4G

附加说明

隐藏参数说明

results matching ""

    No results matching ""