目录

Search

  1. 前言
  2. 引用数据简介
  3. Analyst 工具中的引用表
  4. Developer 工具中的引用数据
  5. 分类器模型
  6. 概率模型
  7. 引用数据和 Informatica Big Data Management

引用数据指南

引用数据指南

概率模型概览

概率模型概览

概率模型是您在内容集中创建的引用数据对象。使用概率模型可以分析包含多个数据值的数据字符串。概率模型标识字符串中每个值中的信息类型。可以将概率模型添加到标签创建器转换和解析器转换中。
使用标签创建器转换中的概率模型为输入字符串中的每个值分配一个描述性标签。标签创建器转换将标签写入单个输出端口。在解析器转换中使用概率模型可以将输入字符串中的每个值写入代表值中的信息的端口。解析器转换为每种类型的信息创建一个输出端口。
您可以在 Developer tool 中设计和编译概率模型。定义概率模型时,将一系列数据行添加到模型中并为每个行中的每个值分配一个标签。编译概率模型时,Developer tool 在数据值和您添加的标签之间创建关联。标签创建器转换和解析器转换使用自然语言处理将概率模型数据与输入端口数据进行比较。
自然语言处理使用以下技术来确定数据值中信息的类型:
  • 自然语言处理可以识别相似的数据值,并为这些值应用相同的标签。
  • 自然语言处理可以将某个数据值与字符串中的相邻值进行比较。自然语言处理分析值序列以了解每个字符串的用法并确认字符串代表的信息类型。