能力说明
能力名称:全网数据搜索
功能简介
目前只提供近7天预处理后的数据,包含资源类型为资讯(source_type=0)主贴,微博主贴,微博转发,论坛主贴,贴吧主贴,微信主贴。
能力根据用户配置的关键词(非必填),在标题和正文字段中按规则搜索数据
注意:
启动后数据库新增的数据不会被输出
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
| - | - | - | - | - |
| 资源类型 | string | 是 | | 数据的资源类型 |
| 资源子类型 | string | 是 | | 数据的资源子类型 |
| 开始时间 | string | 否 | | 数据的发布时间(release_date) |
| 结束时间 | string | 否 | | 数据的发布时间(release_date) |
| 输出条数 | string | 否 | | 不填表示输出全部 |
| 关键词 | string | 否 | | 多个关键词之间用英文逗号(,)分割,表示[或]关系, 用空格分割,表示[与]关系 |
输入简介
无
输入数据样例
资源类型:资讯
资源子类型:主贴
关键词:特朗普
输出简介
资讯数据包含的字段:见文档末尾
微博数据包含的字段:见文档末尾
输出数据样例
{
...
"source_type": "0",
"title": "美国升级贸易战,无助于解决问题",
"url": "http://opinion.china.com.cn/opinion_17_192917.html",
"content": "...彼得森国际经济研究所所长亚当·波森直言,特朗普政府加征关税的策略注定会失败...",
"release_date": "2018-09-19 00:00:00"
...
}
参考指标
- 数据质量:99%
- 处理性能:未知
附加说明
无
隐藏参数说明
无
资讯数据包含的字段
url
url_crc
title
title_crc
fmt_title
author
navigation
abstract
content
content_crc
format_content
fmt_format_content
media_name
release_date
rel_type
source_type
keywords
download_date
refer_url
content_media_name
picture_list
微博数据包含的字段
attitudes_count
author
authorurl
birthday_normalized
comment_count
content
content_crc
download_date
fmt_author
fmt_format_content
fmt_title
format_content
isforward
keywords
location_normalized
media_id
media_name
media_url
picture_list
post_source
quote_count
refer_url
rel_type
release_date
source_type
title
title_crc
uid
url
url_crc
user_url
user_url_crc
forward_content
forward_attitudes_count
forward_author
forward_picture_list
forward_uid
forward_comments_count
forward_refer_url
forward_post_source
forward_quote_count
forward_release_date
forward_user_url
forward_url