目录

Search

  1. 前言
  2. 引用数据简介
  3. Analyst 工具中的引用表
  4. Developer 工具中的引用数据
  5. 分类器模型
  6. 概率模型
  7. 引用数据和 Informatica Big Data Management

引用数据指南

引用数据指南

用于地址验证的引用数据

用于地址验证的引用数据

在 Hadoop 环境中运行地址验证映射时,地址引用数据文件必须驻留在运行该映射的每个数据节点上。Informatica Big Data Management 会安装一个 shell 脚本,您可以使用该脚本在数据节点上安装文件。
使用 shell 脚本可通过单个操作在数据节点上安装地址引用数据文件。该脚本会读取一个文件,其中包含节点的名称或 IP 地址。该脚本会将地址引用数据文件复制到此文件标识的每个节点。
该脚本的名称是
copyRefDataToComputeNodes.sh
可以在 Informatica Big Data Management 安装中的以下目录找到该脚本:
<Informatica 安装目录>/tools/dq/av
下表描述了该脚本使用的选项:
选项
说明
-n
一个文件,其中包含 Hadoop 群集中的数据节点的名称或 IP 地址的列表。请在文件中单独的行上输入每个节点名称或 IP 地址。
默认情况下,该脚本将从
$BASEDIR/HadoopDataNodes
目录(其中
$BASEDIR
是 shell 脚本的位置)读取文件。
-p
一个提示,提示您确认是否要安装地址引用数据文件。
默认情况下,该脚本会显示一个提示,提示您确认是否要将源目录中的文件复制到数据节点上的目标目录。如果按计划运行 shell 脚本,则可以禁用提示。
默认选项值为 Y。要禁用提示,请将值设置为 N。
-s
该脚本复制到节点的地址引用数据文件的源目录。
默认情况下,该脚本将从本地计算机上的
/reference_data
目录读取文件。
地址引用数据文件使用文件扩展名 .MD。源目录必须仅包含地址引用数据文件,不能包含任何其他文件。
-t
每个节点上的一个目录,该脚本会将地址引用数据文件复制到此目录。
默认情况下,该脚本会将文件复制到每个节点上的
/reference_data
目录。
-u
运行该脚本的用户的用户名。用户必须拥有节点的无密码安全 shell 访问权限。