Para reduzir o número de entidades extraídas do Cloudera Navigator, o Metadata Manager filtra os modelos de consulta Hive e Impala. Por padrão, o Metadata Manager extrai somente os modelos de consulta que criam novas entidades ou gravam em entidades existentes. O Metadata Manager não extrai modelos de consulta que gravam dados em entidades desconhecidas.
Quando você carrega um recurso do Cloudera Navigator, o Metadata Manager extrai todos os modelos de consulta Hive e Impala que criam novas entidades ou inserem dados em entidades existentes.
Por exemplo, um modelo de consulta Hive contém a seguinte consulta:
INSERT OVERWRITE TABLE sales_sorted SELECT s_neighbor,price from sales ORDER BY price
Essa consulta grava dados na tabela Hive sales_sorted. Portanto, o Metadata Manager extrai esse modelo de consulta Hive.
Por padrão, o Metadata Manager não extrai os modelos de consulta Hive ou Impala que leem dados, mas não os gravam. O Metadata Manager também não extrai os modelos de consulta que gravam dados em entidades desconhecidas. No Cloudera Navigator, as entidades desconhecidas são marcadas com o ícone de reticências (
...
).
Por exemplo, um modelo de consulta Hive contém a seguinte consulta:
SELECT * FROM cust WHERE state = 'CA'
Essa consulta lê os dados da tabela Hive cust, mas não grava dados em nenhuma tabela downstream. Portanto, o Metadata Manager não extrai esse modelo de consulta Hive.
Você pode desativar a filtragem de modelos de consulta Hive e Impala. Para o Metadata Manager extrair todos os modelos de consulta Hive e Impala, desative a opção
Ativar Filtragem
quando você criar ou editar um recurso do Cloudera Navigator.