能力说明

能力名称:问答评论

功能简介

问答评论能力可以分别选择一次性采集或周期性采集两种采集方式

(1)选择一次性时,根据问答链接一次性采集该问答下的所有评论

(2)选择周期性时,根据问答链接按照设置的周期采集该问答下的评论数据,48小时之内,根据设置的周期采集,48小时后停止采集

配置参数

参数名称 参数类型 是否必填 默认值 参数说明
任务执行编号 数字 0 0-99任意自然数,能力会根据任务编号来判断是否继续执行上一次任务,数字不变则继续执行,反之则重采
请输入链接 文本 直接部署链接时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在10000以内;当能力接收上层数据流时可不填
选择历史还是实时任务 文本 选择是一次性任务/周期性任务,一次性任务即历史任务,采集一次终止,周期任务即实时任务,即需要设置采集周期,每隔多长时间采集一次
采集频度 数字 240 选择周期性任务时填写采集的频度(即采集周期,单位:分钟),默认240分钟,可下拉列表选择,48小时之内,根据设置的周期采集,48小时后停止采集

输入简介

输入需要采集评论的问答链接,多个以回车换行分隔

输入数据样例

http://www.zhihu.com/question/53958210
http://www.babytree.com/ask/body/43400089

支持如下两种上游流入格式:

第一种字符串:["http://xxx.xxx.xxx"]
第二种json传:{"url","http://xxx.xxx.xxx"}

输出简介

输出为问答相对应的问答评论数据

输出数据样例

部分输出字段简介:

1.author:评论人

2.format_content:评论内容

3.release_date:评论发布时间

输出详细字段信息举例如下:

{
    "author":"匿名用户",
    "title":"首先,阿里巴巴自身有没有顽疾没有很好的根除还需要自身细细考量,怎样才能让这些重视知识产权的国家不要抓住不放,很难讲自身不足与政治影响的因素那个因素更多些。政治影响的程度有多大,更多取决于把“阿里巴巴再次被列入恶名市场”的一方所想要达到的政治目的。 其次,就消费者及权利人维权的难度和困境来讲,阿里巴巴再次被列入恶名市场不能完全说此次入榜冤枉。毕竟境外权利人也好,一些国家政治需要也罢。都会紧紧盯着阿里这个庞大的体系,树大招风是必然。一味的驳斥,并不会阻止这些人根据需要多方搜集数据佐证其判断。 要想不被诟病,最",
    "refer_url":"http://www.zhihu.com/question/53958210#1516156012796",
    "c_url":"http://www.zhihu.com/question/53958210",
    "rel_type":"c",
    "release_date":"2018-01-15",
    "download_date":"2018-01-17 10:26:52",
    "source_type":"5",
    "url":"http://www.zhihu.com/question/53958210#3595257466",
    "format_content":"首先,阿里巴巴自身有没有顽疾没有很好的根除还需要自身细细考量,怎样才能让这些重视知识产权的国家不要抓住不放,很难讲自身不足与政治影响的因素那个因素更多些。政治影响的程度有多大,更多取决于把“阿里巴巴再次被列入恶名市场”的一方所想要达到的政治目的。 其次,就消费者及权利人维权的难度和困境来讲,阿里巴巴再次被列入恶名市场不能完全说此次入榜冤枉。毕竟境外权利人也好,一些国家政治需要也罢。都会紧紧盯着阿里这个庞大的体系,树大招风是必然。一味的驳斥,并不会阻止这些人根据需要多方搜集数据佐证其判断。 要想不被诟病,最好的姿态是真诚对待问题,有则努力改之,无则加勉。只有消费者和权利人都站出来说“阿里巴巴再次被列入恶名市场”是冤枉,才更有说服力。",
    "from_flag":"comment_info"
}

相关能力

参考指标

  • 数据质量:准确率:95%

  • 处理性能:100条/min

CPU:4 内存:4G

附加说明

隐藏参数说明

results matching ""

    No results matching ""