能力说明

能力名称:英文语义特征提取

功能简介

对指定字段进行人名,地名,机构名,关键词提取

配置参数

参数名称 参数类型 是否必填 默认值 参数说明
服务端口 数值 5008 是指服务的端口号,相同能力的端口号不能相同
处理人名字段 文本 设置要识别人名的字段,以“,”分隔
处理机构名字段 文本 设置要识别机构名的字段,以“,”分隔
处理地名字段 文本 设置要识别地名的字段,以“,”分隔
处理关键词字段 文本 设置要识关键词的字段,以“,”分隔
识别关键词的个数 数值 10 设置要识关键词的个数
关键词的分隔符 文本 设置关键词的分隔符,默认是空格

输入简介

输入数据样例

{"fmt_format_content":"His name is Li Ming, a student of Peking University and his native place is Henan."}

输出简介

对于有提取结果的

1.提取的人名新增“person_name”字段,该字段为数组格式。数组中每一个元素为json格式,其中str表示提取的人名,offset表示在文章中的偏移,field表示提取字段。

2.提取的地名新增“loc_name”字段,该字段为数组格式。数组中每一个元素为json格式,其中str表示提取的地名,offset表示在文章中的偏移,field表示提取字段。

3.提取的机构名新增“org_name”字段,该字段为数组格式。数组中每一个元素为json格式,其中str表示提取的机构名,offset表示在文章中的偏移,field表示提取字段。

4.提取的关键词新增“字段名_keywords”字段,该字段为string格式。由若干个关键词与分隔符拼接出的字符串

输出数据样例

{
    "person_name":[
        {
            "str": "Li Ming",
            "offset": 12,
            "field": "fmt_format_content"
        }
    ],
    "loc_name":[
        {
            "str": "Henan",
            "offset": 76,
            "field": "fmt_format_content"
        }
    ],
    "org_name":[
        {
            "str": "Peking University",
            "offset": 34,
            "field": "fmt_format_content"
        }
    ],
    "fmt_format_content_keywords":"li ming;peking university;native place;student;henan",
    "fmt_format_content":"His name is Li Ming, a student of Peking University and his native place is Henan."。
}

相关能力

参考指标

  • 数据质量:90%

  • 处理性能:1400条/s,300条/s

附加说明

隐藏参数说明

results matching ""

    No results matching ""