Hi, I'm Ask INFA!
What would you like to know?
ASK INFAPreview
Please to access Bolo.

Sumário

Search

  1. Prefácio
  2. Usando o Metadata Manager
  3. Configurando o Metadata Manager
  4. Recursos de Aplicativo
  5. Recursos de Glossário Comercial
  6. Recursos de Inteligência Comercial
  7. Recursos Personalizados
  8. Recursos da Integração de Dados
  9. Recursos de Modelagem de Dados
  10. Recursos de Gerenciamento de Banco de Dados
  11. Recursos universais
  12. Gerenciando Recursos
  13. Carregando e Monitorando Recursos
  14. Gerenciando Permissões
  15. Migração de Recursos
  16. Migração de Repositório
  17. Logon do Metadata Manager
  18. Arquivos de Propriedades do Metadata Manager
  19. Arquivos de Configuração de Recurso
  20. Glossário

Metadata Manager Administrator Guide

Metadata Manager Administrator Guide

Vinculação das Entidades do Cloudera

Vinculação das Entidades do Cloudera

O Metadata Manager pode exibir links de linhagem de dados entre as entidades em um recurso do Cloudera Navigator e os objetos de dados em outros recursos. Para vincular tabelas de Hive com objetos de dados em outros recursos em pacote ou em recursos universais, use atribuições de conexão. Para vincular arquivos HDFS com objetos de dados em outros recursos em pacote, em recursos personalizados ou em recursos universais, use um arquivo de regras de vinculação.
O Metadata Manager vincula tabelas Hive a um recurso do Cloudera Navigator a objetos de dados em outro recurso quando você configura as atribuições de conexão entre as fontes de metadados. Por exemplo, uma sessão do PowerCenter carrega dados para uma tabela Hive de destino que existe na sua distribuição Cloudera. Antes que você possa exibir a linhagem de dados entre o destino do PowerCenter e a tabela Hive, configure uma atribuição de conexão entre o repositório do PowerCenter e a distribuição Cloudera.
O Metadata Manager não usa atribuições de conexão para vincular arquivos HDFS em um recurso do Cloudera Navigator a objetos de dados em outros recursos. Para vincular arquivos HDFS a objetos de dados em outros recursos, use um arquivo de regras de vinculação.
Por exemplo, a distribuição Cloudera contém o arquivo HDFS big-customer.csv. Use os dados nesse arquivo para preencher o objeto de dados de arquivo simples CUST na ferramenta Developer. O objeto de dados de arquivo simples CUST é usado como uma origem em um mapeamento HDFS.
Crie um arquivo de regras de vinculação para vincular o arquivo HDFS big-customer.csv ao objeto de dados de arquivo simples CUST. Adicione uma condição de vinculação que cria links do arquivo HDFS para as colunas no grupo de saída do objeto de dados de arquivo simples.
No Metadata Manager, o objeto de dados de arquivo simples CUST pertence à classe Objeto de Dados HDFS. O grupo de saída pertence à classe Leitura de Objeto de Dados. As colunas no grupo de saída pertencem à classe Atributo.
Use o seguinte arquivo para criar os links:
<?xml version="1.0" encoding="UTF-16LE"?> <ruleSet name="Link HDFS files to Informatica Platform FF Data Objects"> <sourceResource name="Cloudera01"/> <targetResource name="InfaPlatform01"/> <rule name="Link HDFS big-customer.csv to Informatica Platform CUST FF columns" direction="SourceToTarget"> <sourceFilter > <element class="HDFS File"/> </sourceFilter> <targetFilter> <!-- We must link to features. If we link to structures only, Metadata Manager will not find upstream links to the HDFS file. --> <element class="HDFS Data Object"> <element class="Data Object Read"> <element class="Attribute"/> </element> </element> </targetFilter> <link condition="source.Name = 'big-customer.csv' AND target.parent.Name = 'output' AND target.parent.parent.Name = 'CUST'"/> </rule> </ruleSet>
Neste exemplo, a cláusula
target.parent.Name = 'output'
na condição de vínculo identifica o grupo de saída. A cláusula
target.parent.parent.Name = 'CUST'
identifica o objeto de dados de arquivo simples.
Para fazer o upload do arquivo de regras de vinculação, edite o recurso do Cloudera Navigator. Depois que você fizer o upload do arquivo de regras de vinculação e recarregar o recurso, o Metadata Manager criará os links de linhagem. O Metadata Manager cria um link do arquivo HDFS big-customer.csv a cada coluna no grupo de saída do objeto de dados de arquivo simples CUST.
Para obter mais informações sobre links baseados em regras, consulte o
Guia de Integração de Metadados Personalizados do Metadata Manager
.