Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Bolo.

目录

Search

  1. 前言
  2. 引用数据简介
  3. Analyst 工具中的引用表
  4. Developer 工具中的引用数据
  5. 分类器模型
  6. 概率模型
  7. 引用数据和 Informatica Big Data Management

引用数据指南

引用数据指南

用于地址验证的引用数据

用于地址验证的引用数据

在 Hadoop 环境中运行地址验证映射时,地址引用数据文件必须驻留在运行该映射的每个数据节点上。Informatica Big Data Management 会安装一个 shell 脚本,您可以使用该脚本在数据节点上安装文件。
使用 shell 脚本可通过单个操作在数据节点上安装地址引用数据文件。该脚本会读取一个文件,其中包含节点的名称或 IP 地址。该脚本会将地址引用数据文件复制到此文件标识的每个节点。
该脚本的名称是
copyRefDataToComputeNodes.sh
可以在 Informatica Big Data Management 安装中的以下目录找到该脚本:
<Informatica 安装目录>/tools/dq/av
下表描述了该脚本使用的选项:
选项
说明
-n
一个文件,其中包含 Hadoop 群集中的数据节点的名称或 IP 地址的列表。请在文件中单独的行上输入每个节点名称或 IP 地址。
默认情况下,该脚本将从
$BASEDIR/HadoopDataNodes
目录(其中
$BASEDIR
是 shell 脚本的位置)读取文件。
-p
一个提示,提示您确认是否要安装地址引用数据文件。
默认情况下,该脚本会显示一个提示,提示您确认是否要将源目录中的文件复制到数据节点上的目标目录。如果按计划运行 shell 脚本,则可以禁用提示。
默认选项值为 Y。要禁用提示,请将值设置为 N。
-s
该脚本复制到节点的地址引用数据文件的源目录。
默认情况下,该脚本将从本地计算机上的
/reference_data
目录读取文件。
地址引用数据文件使用文件扩展名 .MD。源目录必须仅包含地址引用数据文件,不能包含任何其他文件。
-t
每个节点上的一个目录,该脚本会将地址引用数据文件复制到此目录。
默认情况下,该脚本会将文件复制到每个节点上的
/reference_data
目录。
-u
运行该脚本的用户的用户名。用户必须拥有节点的无密码安全 shell 访问权限。