能力说明
能力名称:网页快照
功能简介
根据url从HDFS中获取数据的快照内容,也可以只查询看是否存在
配置参数
| 参数名称 | 参数类型 | 是否必填 | 默认值 | 参数说明 |
|---|---|---|---|---|
| API地址 | 文本 | 是 | http://api.reidx.com/rest/ium/query_orig | 获取平台的快照数据的地址 |
| Field | 文本 | 是 | url | 输入的url字段名称 |
| 仅检测数据是否存在快照 | 文本 | 是 | true | 是否只判断存在 |
输入简介
输入数据为json,根据其中的url字段(由field配置)获得url
若输入数据有source_type字段,则会按照指定source_type的查询方法进行查询
输入数据样例
{"url":"http://www.abc.com/1.html"}
输出简介
输出是否存在和快照内容
是否存在体现在能力关联关系的"成功"和"失败"上
注意:此能力会在输出快照内容中保留原始输入的字段信息,且若快照字段和原始输入字段有重名,将使用原始输入字段值
输出数据样例
{
"url":"xxx",
"title":"xxx"
...其他字段
}