能力说明

能力名称:全网数据搜索

功能简介

目前只提供近7天预处理后的数据,包含资源类型为资讯(source_type=0)主贴微博主贴微博转发论坛主贴贴吧主贴微信主贴

能力根据用户配置的关键词(非必填),在标题正文字段中按规则搜索数据

注意:

启动后数据库新增的数据不会被输出

配置参数

| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |

| - | - | - | - | - |

| 资源类型 | string | 是 | | 数据的资源类型 |

| 资源子类型 | string | 是 | | 数据的资源子类型 |

| 开始时间 | string | 否 | | 数据的发布时间(release_date) |

| 结束时间 | string | 否 | | 数据的发布时间(release_date) |

| 输出条数 | string | 否 | | 不填表示输出全部 |

| 关键词 | string | 否 | | 多个关键词之间用英文逗号(,)分割,表示[]关系, 用空格分割,表示[]关系 |

输入简介

输入数据样例

资源类型:资讯

资源子类型:主贴

关键词:特朗普

输出简介

资讯数据包含的字段:见文档末尾

微博数据包含的字段:见文档末尾

输出数据样例

{

...



"source_type": "0",



"title": "美国升级贸易战,无助于解决问题",



"url": "http://opinion.china.com.cn/opinion_17_192917.html",



"content": "...彼得森国际经济研究所所长亚当·波森直言,特朗普政府加征关税的策略注定会失败...",



"release_date": "2018-09-19 00:00:00"



...

}

参考指标

  • 数据质量:99%
  • 处理性能:未知

附加说明

隐藏参数说明

资讯数据包含的字段

url

url_crc

title

title_crc

fmt_title

author

navigation

abstract

content

content_crc

format_content

fmt_format_content

media_name

release_date

rel_type

source_type

keywords

download_date

refer_url

content_media_name

picture_list

微博数据包含的字段

attitudes_count

author

authorurl

birthday_normalized

comment_count

content

content_crc

download_date

fmt_author

fmt_format_content

fmt_title

format_content

isforward

keywords

location_normalized

media_id

media_name

media_url

picture_list

post_source

quote_count

refer_url

rel_type

release_date

source_type

title

title_crc

uid

url

url_crc

user_url

user_url_crc

forward_content

forward_attitudes_count

forward_author

forward_picture_list

forward_uid

forward_comments_count

forward_refer_url

forward_post_source

forward_quote_count

forward_release_date

forward_user_url

forward_url

results matching ""

    No results matching ""