能力说明
能力名称:微博_用户信息
功能简介
根据新浪微博用户id,采集该用户的相关信息; 采集用户信息为非登录状态下可查看的用户信息内容 (比登录状态下可查看的信息内容少,详情见输出简介配图)
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 请输入微博用户id | 文本 | 否 | 无 | 直接部署用户id时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在100以内;当能力接收上层数据流时可不填 |
| 流入此能力的json中提取的key | 文本 | 是 | uid | 上游能力流过来的json流中提取key名称作为本能力的输入 |
输入简介
输入用户id,多个以换行分隔(换行操作:shift+回车),建议部署上限在100以内 可从该能力配置中进行填写,也可用通过上游能力输入。通过上游能力输入时,建议使用 采集格式转换 能力对输入的数据进行格式规整。
支持如下两种上游流入格式:
第一种字符串:["1222419165"]
第二种json传:{"uid","1222419165"}
输入数据样例
输入新浪微博用户id示例如下:
注:直接部署用户id,当链接中不能找到用户id时,建议从网页源码中分析提取用户id
1222419165
1222419163
输出简介
输出用户id对应的新浪微博用户信息,为json格式。每个人物的数据字段可能不尽相同,取决于该人物在人物主页中所展示的字段内容。
如下图所示,当前人物仅有左边红框内的可见字段。

输出数据样例
部分输出字段简介:
1.uid:用户id
2.nick_name:昵称
3.location:所在地
4.verified_reason:认证名称
5.statuses_count:微博数
6.followers_count:粉丝数
7.birthday:生日
8.daren_score:达人积分
9.verified_type:认证信息
10.verified_reason:认证原因
11.education:学校信息
12.friends_count:关注数
13.gender:性别(1男2女)
输出详细字段信息举例如下:
{
"uid":"2087425303",
"daren_score":"0.0",
"birthday":"1986年12月16日",
"reidx_uid":"7fdc37e8-015e-1000-fe8d-8265fc728095",
"location":"福建 宁德 ",
"taskid":"1510",
"verified_type":"3",
"source_type":"4",
"verified_reason":"母婴育儿博主",
"education":"[{"school_name":"","school_type":""}]",
"type":"u",
"statuses_count":"1300",
"vip_name":"Lv.21",
"nick_name":"范光华-白血病不可怕",
"sentiment_status":"已婚 ",
"verified":"3",
"active_days":"0",
"gender":"1",
"trust_score":"0.0",
"task_serial":"192.168.253.54-7fdc37e8-015e-1000-fe8d-8265fc728095",
"followers_count":"2080",
"avatar_large_url":"http://tva4.sinaimg.cn/crop.0.0.640.640.180/7c6b9517jw8evzlz8a9dij20hs0hswfl.jpg",
"profile_url":"http://www.weibo.com/u/2087425303?/info?",
"sex_preference":"异性恋 ",
"vip_score":"0",
"media_url":"weibo.com",
"career":"[{"org_name":"曾经是个美发师","time_rang":"","position":""}]",
"download_date":"2017-11-17 14:45:40",
"level_now":"Lv.21",
"url":"http://weibo.com/u/2087425303",
"from_flag":"sina_weibo1.3",
"vip_speed":"0",
"friends_count":"11",
"rel_type":"u",
"media_name":"新浪微博",
"profile_image_url":"http://tva4.sinaimg.cn/crop.0.0.640.640.180/7c6b9517jw8evzlz8a9dij20hs0hswfl.jpg"
}
字段明细表
相关能力
无
参考指标
数据质量:准确率:99.2%
处理性能:7200条/小时
CPU:4 内存:4G
附加说明
- 采全率:90%以上 注:不包括已失效的人物链接
- 准确率:95%以上
- 采集速度:2人物链接/秒;7200人物链接/小时
- 改版后响应速度:工作时间4小时内;非工作时间一天内。
隐藏参数说明
无
粗体
