目录

Search

  1. 前言
  2. 引用数据简介
  3. Analyst 工具中的引用表
  4. Developer 工具中的引用数据
  5. 分类器模型
  6. 概率模型

引用数据指南

引用数据指南

引用数据概览

引用数据概览

引用数据对象标识一组您在为数据质量操作配置转换时可以选择的数据值。可以在 Developer 工具和 Analyst 工具中创建引用数据对象。还可以将引用数据对象导入模型存储库和文件系统。可以使用 Data Quality Content 安装程序导入引用数据对象以及将引用数据安装到文件系统中。
可以创建和编辑以下类型的引用数据:
引用表
引用表包含一组数据值的标准版本和替代版本。将引用表添加到 Developer 工具中的某个转换,以确认源数据值是准确的且已正确设置格式。
数据库表至少包含两个列。一列包含标准或首选版本的字符串,其他列包含替代版本。将引用表添加到转换时,该转换将在输入端口数据中搜索同时显示在引用表中的值。可以使用任何对所处理的数据项目有用的数据来创建引用表。
内容集
内容集是在模型存储库或文件中指定引用数据值的模型存储库对象。将内容集添加到某个转换中时,该转换在输入数据中搜索与内容集中的数据模式匹配的值。
Data Quality Content 安装程序可以安装以下类型的引用数据:
Informatica 引用表
Informatica 开发的存储库对象和数据文件。将加速器对象导入到模型存储库中时,将导入 Informatica 引用表。引用信息类型包括电话区号、邮政编码格式、名、社会保障号格式、职业和首字母缩略词。可以编辑 Informatica 引用表。
Informatica 内容集
Informatica 开发的存储库对象和数据文件。将加速器对象导入到模型存储库中时,将导入内容集。内容集包含不同类型的引用数据,您可以将其用于对数据质量转换执行搜索操作。
地址引用数据文件
包含某个国家/地区的可投递地址数据的引用数据文件。地址验证器转换将读取该引用数据。无法创建或编辑地址引用数据文件。
地址引用数据对于某个定义的时间段是最新的,因此您必须定期(例如每个季度一次)刷新数据。无法查看或编辑地址引用数据。
标识填充文件
包含有关个人、家庭和公司标识的信息的引用数据文件。匹配转换和比较转换使用填充文件在输入数据中查找潜在标识。无法创建或编辑地址标识填充文件。