能力说明
能力名称:问答评论
功能简介
问答评论能力可以分别选择一次性采集或周期性采集两种采集方式
(1)选择一次性时,根据问答链接一次性采集该问答下的所有评论
(2)选择周期性时,根据问答链接按照设置的周期采集该问答下的评论数据,48小时之内,根据设置的周期采集,48小时后停止采集
配置参数
参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
---|---|---|---|---|
任务执行编号 | 数字 | 是 | 0 | 0-99任意自然数,能力会根据任务编号来判断是否继续执行上一次任务,数字不变则继续执行,反之则重采 |
请输入链接 | 文本 | 否 | 无 | 直接部署链接时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在10000以内;当能力接收上层数据流时可不填 |
选择历史还是实时任务 | 文本 | 是 | 无 | 选择是一次性任务/周期性任务,一次性任务即历史任务,采集一次终止,周期任务即实时任务,即需要设置采集周期,每隔多长时间采集一次 |
采集频度 | 数字 | 否 | 240 | 选择周期性任务时填写采集的频度(即采集周期,单位:分钟),默认240分钟,可下拉列表选择,48小时之内,根据设置的周期采集,48小时后停止采集 |
输入简介
输入需要采集评论的问答链接,多个以回车换行分隔
输入数据样例
http://www.zhihu.com/question/53958210
http://www.babytree.com/ask/body/43400089
支持如下两种上游流入格式:
第一种字符串:["http://xxx.xxx.xxx"]
第二种json传:{"url","http://xxx.xxx.xxx"}
输出简介
输出为问答相对应的问答评论数据
输出数据样例
部分输出字段简介:
1.author:评论人
2.format_content:评论内容
3.release_date:评论发布时间
输出详细字段信息举例如下:
{
"author":"匿名用户",
"title":"首先,阿里巴巴自身有没有顽疾没有很好的根除还需要自身细细考量,怎样才能让这些重视知识产权的国家不要抓住不放,很难讲自身不足与政治影响的因素那个因素更多些。政治影响的程度有多大,更多取决于把“阿里巴巴再次被列入恶名市场”的一方所想要达到的政治目的。 其次,就消费者及权利人维权的难度和困境来讲,阿里巴巴再次被列入恶名市场不能完全说此次入榜冤枉。毕竟境外权利人也好,一些国家政治需要也罢。都会紧紧盯着阿里这个庞大的体系,树大招风是必然。一味的驳斥,并不会阻止这些人根据需要多方搜集数据佐证其判断。 要想不被诟病,最",
"refer_url":"http://www.zhihu.com/question/53958210#1516156012796",
"c_url":"http://www.zhihu.com/question/53958210",
"rel_type":"c",
"release_date":"2018-01-15",
"download_date":"2018-01-17 10:26:52",
"source_type":"5",
"url":"http://www.zhihu.com/question/53958210#3595257466",
"format_content":"首先,阿里巴巴自身有没有顽疾没有很好的根除还需要自身细细考量,怎样才能让这些重视知识产权的国家不要抓住不放,很难讲自身不足与政治影响的因素那个因素更多些。政治影响的程度有多大,更多取决于把“阿里巴巴再次被列入恶名市场”的一方所想要达到的政治目的。 其次,就消费者及权利人维权的难度和困境来讲,阿里巴巴再次被列入恶名市场不能完全说此次入榜冤枉。毕竟境外权利人也好,一些国家政治需要也罢。都会紧紧盯着阿里这个庞大的体系,树大招风是必然。一味的驳斥,并不会阻止这些人根据需要多方搜集数据佐证其判断。 要想不被诟病,最好的姿态是真诚对待问题,有则努力改之,无则加勉。只有消费者和权利人都站出来说“阿里巴巴再次被列入恶名市场”是冤枉,才更有说服力。",
"from_flag":"comment_info"
}
相关能力
无
参考指标
数据质量:准确率:95%
处理性能:100条/min
CPU:4 内存:4G
附加说明
无
隐藏参数说明
无