能力说明
能力名称:微博_用户粉丝
功能简介
根据新浪微博用户id一次性采集该用户下的粉丝,可以根据填写的粉丝数来采集
注意:由于网站的限制,每个uid最多能采集到1000条,但以实际采集到的为主,因为新浪微博智能反垃圾系统会自动清除部分广告用户
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 请输入微博用户id | 文本 | 否 | 无 | 直接部署用户id时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在100以内;当能力接收上层数据流时可不填 |
| 流入此能力的json中提取的key | 文本 | 是 | url | 上游能力流过来的json流中提取key名称作为本能力的输入 |
| 设定单个用户采集粉丝条数 | 文本 | 否 | 无 | 设定单个用户采集粉丝条数,默认100,上限1000 |
输入简介
输入新浪微博用户id,多个以换行分隔(换行操作:shift+回车),建议部署上限在100以内
支持如下两种上游流入格式:
第一种字符串:["http://xxx.xxx.xxx"]
第二种json传:{"url","http://xxx.xxx.xxx"}
输入数据样例
输入新浪用户微博id示例:
注:直接部署用户id,当链接中不能找到用户id时,建议从网页源码中分析提取用户id
1222419165
1222419164
输出简介
输出新浪用户id下相应的粉丝数据,为json格式
输出数据样例
部分输出字段简介:
1,uid:粉丝id
2,screen_name:昵称
3,description:简介
4,url:用户微博链接
5,statuses_count:发布的微博数
6,follow_count:关注数
7,followers_count:粉丝数
输出详细字段信息举例如下:
{
"avatar_hd": "https://wx2.sinaimg.cn/orj480/0069oqr1ly8fnf2vdvq30j30ig0igmxv.jpg",
"cover_image_phone": "https://tva1.sinaimg.cn/crop.0.0.640.640.640/9d44112bjw1f1xl1c10tuj20hs0hs0tw.jpg",
"description": "从开始到未来,只为王俊凯?",
"download_date": "2018-01-29 15:49:29",
"follow_count": "1551",
"followers_count": "78",
"from_flag": "sina_weibo1.3",
"gender": "f",
"media_name": "新浪微博",
"media_url": "weibo.com",
"profile_image_url": "https://tvax2.sinaimg.cn/crop.0.0.664.664.180/0069oqr1ly8fnf2vdvq30j30ig0igmxv.jpg",
"refer_url": "http://weibo.com/u/2554017067",
"rel_type": "m",
"screen_name": "阳澄湖的xp蟹",
"source_type": "4",
"statuses_count": "5309",
"taskid": "2463",
"type_list": "粉丝",
"uid": "5635605507",
"url": "http://weibo.com/u/5635605507"
}
字段明细表
相关能力
无
参考指标
数据质量:准确率:98%
处理性能:7200条/小时
CPU:4 内存:4G
附加说明
无
隐藏参数说明
无
