引用数据指南

上一个下一个

用于地址验证的引用数据

在 Hadoop 环境中运行地址验证映射时，地址引用数据文件必须驻留在运行该映射的每个数据节点上。Informatica Big Data Management 会安装一个 shell 脚本，您可以使用该脚本在数据节点上安装文件。

使用 shell 脚本可通过单个操作在数据节点上安装地址引用数据文件。该脚本会读取一个文件，其中包含节点的名称或 IP 地址。该脚本会将地址引用数据文件复制到此文件标识的每个节点。

该脚本的名称是

copyRefDataToComputeNodes.sh

。

可以在 Informatica Big Data Management 安装中的以下目录找到该脚本：

<Informatica 安装目录>/tools/dq/av

下表描述了该脚本使用的选项：

选项	说明
-n	一个文件，其中包含 Hadoop 群集中的数据节点的名称或 IP 地址的列表。请在文件中单独的行上输入每个节点名称或 IP 地址。默认情况下，该脚本将从 $BASEDIR/HadoopDataNodes 目录（其中 $BASEDIR 是 shell 脚本的位置）读取文件。
-p	一个提示，提示您确认是否要安装地址引用数据文件。默认情况下，该脚本会显示一个提示，提示您确认是否要将源目录中的文件复制到数据节点上的目标目录。如果按计划运行 shell 脚本，则可以禁用提示。默认选项值为 Y。要禁用提示，请将值设置为 N。
-s	该脚本复制到节点的地址引用数据文件的源目录。默认情况下，该脚本将从本地计算机上的 /reference_data 目录读取文件。地址引用数据文件使用文件扩展名 .MD。源目录必须仅包含地址引用数据文件，不能包含任何其他文件。
-t	每个节点上的一个目录，该脚本会将地址引用数据文件复制到此目录。默认情况下，该脚本会将文件复制到每个节点上的 /reference_data 目录。
-u	运行该脚本的用户的用户名。用户必须拥有节点的无密码安全 shell 访问权限。

发送反馈