能力说明
能力名称:标引结果转RIS格式
功能简介
判定图标引结果转换为RIS标引结果格式
就是将tag_result内容转换为RIS系统的 {data:{},lable:{}} 的格式
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| 取数据使用的taskID | 文本 | 否 | - | task_id, 不超过8位的数字 |
| 字段黑名单 | 文本 | 否 | - | 不写入Data的字段黑名单, 逗号分隔 |
| 写入Lable的字段名单 | 文本 | 否 | - | 要写入lable的字段,多个用逗号分隔字段名,请阅读后面的备注 |
备注1,关于处理流程:
本能力最终目标是输出data和lable两段内容。
原始输入数据,首先会进行筛选,会根据"内置基础逻辑和内置字段黑名单"及"字段黑名单"参数的情况,将其他字段写入data段。
之后,将会再次扫描原始输入数据,将根据"内置Lable字段"及"写入Lable的字段名单"参数的情况,组织这些字段写入lable段。
因此"写入Lable的字段名单"参数所指示的字段,会同时出现在data和lable中。
但是,当希望输出的lable和data中某个相同字段名但内容需要不一样时,上述配置将无法满足,因此增加了"_origin"逻辑。
"_origin"逻辑就是,data段原则上会排除所有"_origin"结尾的字段名,但,如果"写入Lable的字段名单"配置了"a"字段且原始输入数据同时存在"a"和"a_origin"时,程序会进行如下操作:
data中写入"a"字段,其值使用"a_origin"的值;lable按原逻辑写入"a"字段,其值使用"a"的值。
备注2,"内置Lable字段" 如下: content_multi_md5,article_type,download_date,lable_time,oid,relativity,relavancy,release_date,s_url,source_type,url 以及所有_crc结尾的字段
输入简介
标引结果,需带有tag_result字段
输入数据样例
{
"title":"xxx",
"format_content":"xxx",
"tag_result":{}
}
输出简介
RIS的结果格式
输出数据样例
{
"data":{
"title":"xxx",
"format_content":"xxx"
},
"lable":{
//这里是标签(tag_result)转换出的相关字段
}
}