能力说明

能力名称：英文语义特征提取

功能简介

对指定字段进行人名，地名，机构名，关键词提取

配置参数

参数名称	参数类型	是否必填	默认值	参数说明
服务端口	数值	是	5008	是指服务的端口号，相同能力的端口号不能相同
处理人名字段	文本	否		设置要识别人名的字段，以“，”分隔
处理机构名字段	文本	否		设置要识别机构名的字段，以“，”分隔
处理地名字段	文本	否		设置要识别地名的字段，以“，”分隔
处理关键词字段	文本	否		设置要识关键词的字段，以“，”分隔
识别关键词的个数	数值	否	10	设置要识关键词的个数
关键词的分隔符	文本	否		设置关键词的分隔符，默认是空格

输入简介

输入数据样例

{"fmt_format_content":"His name is Li Ming, a student of Peking University and his native place is Henan."}

输出简介

对于有提取结果的

1.提取的人名新增“person_name”字段，该字段为数组格式。数组中每一个元素为json格式，其中str表示提取的人名，offset表示在文章中的偏移，field表示提取字段。

2.提取的地名新增“loc_name”字段，该字段为数组格式。数组中每一个元素为json格式，其中str表示提取的地名，offset表示在文章中的偏移，field表示提取字段。

3.提取的机构名新增“org_name”字段，该字段为数组格式。数组中每一个元素为json格式，其中str表示提取的机构名，offset表示在文章中的偏移，field表示提取字段。

4.提取的关键词新增“字段名_keywords”字段，该字段为string格式。由若干个关键词与分隔符拼接出的字符串

输出数据样例

{
    "person_name":[
        {
            "str": "Li Ming",
            "offset": 12,
            "field": "fmt_format_content"
        }
    ],
    "loc_name":[
        {
            "str": "Henan",
            "offset": 76,
            "field": "fmt_format_content"
        }
    ],
    "org_name":[
        {
            "str": "Peking University",
            "offset": 34,
            "field": "fmt_format_content"
        }
    ],
    "fmt_format_content_keywords":"li ming;peking university;native place;student;henan",
    "fmt_format_content":"His name is Li Ming, a student of Peking University and his native place is Henan."。
}

参考指标

数据质量：90%
处理性能：1400条/s,300条/s

无

附加说明

无

隐藏参数说明

无

英文语义特征提取