能力说明
能力名称:贴吧评论
功能简介
贴吧评论能力可以分别选择一次性采集或周期性采集两种采集方式
(1)选择一次性时,根据贴吧链接一次性采集该贴吧下的所有评论
(2)选择周期性时,根据贴吧链接按照设置的周期采集该贴吧下的评论数据,48小时之内,根据设置的周期采集,48小时后停止采集
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 任务执行编号 | 数字 | 是 | 0 | 0-99任意自然数,能力会根据任务编号来判断是否继续执行上一次任务,数字不变则继续执行,反之则重采 |
| 请输入链接 | 文本 | 否 | 无 | 直接部署链接时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在10000以内;当能力接收上层数据流时可不填 |
| 选择历史还是实时任务 | 文本 | 是 | 无 | 选择是一次性任务/周期性任务,一次性任务即历史任务,采集一次终止,周期任务即实时任务,即需要设置采集周期,每隔多长时间采集一次 |
| 采集频度 | 数字 | 否 | 240 | 选择周期性任务时填写采集的频度(即采集周期,单位:分钟),默认240分钟,可下拉列表选择,48小时之内,根据设置的周期采集,48小时后停止采集 |
输入简介
输入需要采集评论的贴吧链接,多个以回车换行分隔
输入数据样例
http://guba.sina.com.cn/?s=thread&bid=36993&tid=8420
http://tieba.baidu.com/p/5518612839
输出简介
输出为贴吧相对应的贴吧评论数据
输出数据样例
输出详细字段信息举例如下:
{
"profile_url":"http://www.baidu.com/p/%E6%9C%AB%E6%97%A5%E7%9A%84%E5%AE%A1%E5%88%A4LOVE/body",
"source_type":"2",
"download_date":"2018-03-21 16:29:44",
"url":"http://tieba.baidu.com/p/5586090152#4022116874",
"from_flag":"comment_info",
"format_content":"有人问楼主,来到这边工作安全不安全?违法吗?会不会被抓 安全是肯定的,我也不傻,要是不安全我干嘛还来工作?我自己也是为了赚钱的,要是不安全赚了钱花不出去有什么用? 违法不违法这个放心,在柬埔寨这个国家,bo彩是合法的,大家就参考日本的AV就可以了,就像日本一样。在日本拍AV是合法的,但是在国内如果拍AV的话是违法的。 至于说会不会被抓这个问题,这一点大家放心,公司是有牌照的,并且与实体赌场合作,安全是绝对可以保证的。 可能大家会在网上看到一些消息,哪里哪里被抓了,作为一个内行人我可以很负责人地说,这些被抓的都是因为没有牌照,不正规的公司 不合法去经营的,自然也会被查封。",
"author":"末日的审判LOVE",
"title":"有人问楼主,来到这边工作安全不安全?违法吗?会不会被抓 安全是肯定的,我也不傻,要是不安全我干嘛还来工作?我自己也是为了赚钱的,要是不安全赚了钱花不出去有什么用? 违法不违法这个放心,在柬埔寨这个国家,bo彩是合法的,大家就参考日本的AV就可以了,就像日本一样。在日本拍AV是合法的,但是在国内如果拍AV的话是违法的。 至于说会不会被抓这个问题,这一点大家放心,公司是有牌照的,并且与实体赌场合作,安全是绝对可以保证的。 可能大家会在网上看到一些消息,哪里哪里被抓了,作为一个内行人我可以很负责人地说,这些被抓",
"floor":"7",
"refer_url":"http://tieba.baidu.com/p/5586090152#1521620984115",
"c_url":"http://tieba.baidu.com/p/5586090152",
"rel_type":"c",
"release_date":"2018-03-09 19:25"
}
相关能力
无
参考指标
数据质量:准确率:95%
处理性能:100条/min
CPU:4 内存:4G
附加说明
无
隐藏参数说明
无