能力说明
能力名称:地名提取
功能简介
识别文本中标题或正文中提及的地名与出现次数
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 处理字段 | 文本 | 是 | fmt_format_content | 设置要识别地名的字段,以逗号分隔 |
| 黑名单 | 文本 | 否 | 需要过滤的地名识别结果,以逗号分隔 | |
| 白名单 | 文本 | 否 | 指定必须识别地名,以逗号分隔 | |
| 输出字段名 | 文本 | 是 | loc_name | 输出地名识别结果字段名 |
| 选择识别地名类型 | 文本 | 是 | 全国行政区划地名、外国地名、景点坐标村庄道路类地名。复选项 |
输入简介
无
输入数据样例
{"fmt_format_content":"北京大学"}
输出简介
输出格式为JSONArray。 str表示识别地名字串 areaId为高德地图行政区划ID offset为在文章的起始位置 field表示识别地名来源字段 maplevel为归一化后地名,附带行政所属 coordinates_gaode为高德地图坐标 mask表示地名级别。1表示中国,2表示省/直辖市级,3表示市级,4表示区/县级,6表示村庄道路景点坐标类地名,16表示外国地名或外国景点名
输出数据样例
{"loc_name":[{"str":"北京大学","areaId":"110108","offset":14,"field":"fmt_format_content","maplevel":"中国-北京市-海淀区-北京大学","coordinates_gaode":"116.31088,39.99281","mask":6}]}
相关能力
参考指标
数据质量:95%
处理性能:1300条/s,260条/s
无
附加说明
无
隐藏参数说明
无