目录

Search

  1. 前言
  2. 引用数据简介
  3. Analyst 工具中的引用表
  4. Developer 工具中的引用数据
  5. 分类器模型
  6. 概率模型
  7. 引用数据和 Informatica Big Data Management

引用数据指南

引用数据指南

分类器模型概览

分类器模型概览

分类器模型是内容集中的引用数据对象。使用分类器模型分析包含多个值的长文本字符串。分类器模型确定每个字符串中最常见的信息类型。
将分类器模型添加到分类器转换中。转换搜索分类器模型数据和每个输入行中的数据之间的共有值。转换使用这些共有值对每一行代表的信息类型进行分类。
当输入数据具有以下特性时使用分类器模型:
  • 输入数据包含文本。分类器模型将自然语言处理应用至文本数据以确定文本中信息的类型。自然语言处理检测输入字符串中的相关单词。自然语言处理忽略不相关的单词。
  • 输入数据字符串包含多个值。例如,可以创建在每个字段中包含电子邮件内容的数据列。
分类器转换读取字符串数据类型。转换对输入字符串的长度没有限制。
在 Developer 工具中编译分类器模型。编译模型时,将在模型中的相似数据值之间创建关联。分类器转换使用编译的数据搜索输入数据中的信息。