目录

Search

  1. 前言
  2. 引用数据简介
  3. Analyst 工具中的引用表
  4. Developer 工具中的引用数据
  5. 分类器模型
  6. 概率模型
  7. 引用数据和 Informatica Big Data Management

引用数据指南

引用数据指南

概率模型和分类器模型的规则和准则

概率模型和分类器模型的规则和准则

模型存储库中的每个概率模型和分类器模型都标识了 Informatica 目录结构中的一个文件。该文件包含数据值以及您在 Developer tool 中向模型添加的标签。文件中还包含定义数据值与标签之间关联的编译逻辑。
使用概率模型或分类器模型时,请注意以下规则和准则:
  • 当您运行包含模型的映射时,数据集成服务会将编译的模型逻辑应用到转换输入数据。数据集成服务不会在映射运行时读取模型中的数据值或标签。
  • 您可以选择从概率模型或分类器模型中删除数据值和标签。例如,您可能会决定从模型中删除敏感数据或专有数据。您可以在 Developer tool 中删除个别数据值和标签。您可以在从模型存储库中导出模型时删除所有数据值和标签。
    如果您从模型中删除所有数据值和标签,将无法编译该模型。
  • 当您从模型删除一个或多个数据值或标签时,编译的模型逻辑将不再代表模型文件中的当前数据。要同步模型逻辑与数据值和标签,请重新编译模型。如果要保持当前的模型逻辑,则不要编译模型。
  • 要保护分类器模型或概率模型中的数据,请备份 Informatica 目录结构中的模型文件。请在从模型中删除所有数据值和标签之前备份该文件。
  • 在内容管理服务主机计算机中找到模型文件。
    概率模型文件的默认位置和文件扩展名如下:
    <Informatica 安装目录>/tomcat/bin/ner/<文件名>.ner
    分类器模型文件的默认位置和文件扩展名如下:
    <Informatica 安装目录>/tomcat/bin/classifier/<文件名>.classifier
  • 如果您升级了 Informatica 安装,在将模型用于映射之前,可能需要先对概率模型和分类器模型进行编译。如果模型不包含任何数据,可使用包含数据的备份文件替换 Informatica 目录结构中的当前文件。