能力说明
能力名称:英文语义特征提取
功能简介
对指定字段进行人名,地名,机构名,关键词提取
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 服务端口 | 数值 | 是 | 5008 | 是指服务的端口号,相同能力的端口号不能相同 |
| 处理人名字段 | 文本 | 否 | 设置要识别人名的字段,以“,”分隔 | |
| 处理机构名字段 | 文本 | 否 | 设置要识别机构名的字段,以“,”分隔 | |
| 处理地名字段 | 文本 | 否 | 设置要识别地名的字段,以“,”分隔 | |
| 处理关键词字段 | 文本 | 否 | 设置要识关键词的字段,以“,”分隔 | |
| 识别关键词的个数 | 数值 | 否 | 10 | 设置要识关键词的个数 |
| 关键词的分隔符 | 文本 | 否 | 设置关键词的分隔符,默认是空格 |
输入简介
输入数据样例
{"fmt_format_content":"His name is Li Ming, a student of Peking University and his native place is Henan."}
输出简介
对于有提取结果的
1.提取的人名新增“person_name”字段,该字段为数组格式。数组中每一个元素为json格式,其中str表示提取的人名,offset表示在文章中的偏移,field表示提取字段。
2.提取的地名新增“loc_name”字段,该字段为数组格式。数组中每一个元素为json格式,其中str表示提取的地名,offset表示在文章中的偏移,field表示提取字段。
3.提取的机构名新增“org_name”字段,该字段为数组格式。数组中每一个元素为json格式,其中str表示提取的机构名,offset表示在文章中的偏移,field表示提取字段。
4.提取的关键词新增“字段名_keywords”字段,该字段为string格式。由若干个关键词与分隔符拼接出的字符串
输出数据样例
{
"person_name":[
{
"str": "Li Ming",
"offset": 12,
"field": "fmt_format_content"
}
],
"loc_name":[
{
"str": "Henan",
"offset": 76,
"field": "fmt_format_content"
}
],
"org_name":[
{
"str": "Peking University",
"offset": 34,
"field": "fmt_format_content"
}
],
"fmt_format_content_keywords":"li ming;peking university;native place;student;henan",
"fmt_format_content":"His name is Li Ming, a student of Peking University and his native place is Henan."。
}
相关能力
参考指标
数据质量:90%
处理性能:1400条/s,300条/s
无
附加说明
无
隐藏参数说明
无