La compatibilidad entre las páginas de códigos es esencial para que el movimiento de datos sea preciso cuando el servicio de integración de PowerCenter se ejecuta en modo de movimiento de datos Unicode.
Una página de códigos puede ser compatible con otra página de códigos o puede ser un subconjunto o superconjunto de otra página de códigos:
Compatible. Dos páginas de códigos son compatibles cuando los caracteres codificados en las dos páginas de códigos son prácticamente idénticos. Por ejemplo, las páginas de códigos JapanEUC y JIPSE contienen caracteres idénticos y son compatibles entre sí. El repositorio de PowerCenter y el proceso de servicio de integración de PowerCenter pueden usar una de estas páginas de códigos y pueden pasar datos en ambos sentidos sin pérdidas.
Superconjunto. Una página de códigos es un superconjunto de otra página de códigos cuando contiene todos los caracteres codificados de la otra página de códigos y caracteres adicionales no codificados en la otra página de códigos. Por ejemplo, MS Latin1 es un superconjunto de US-ASCII porque contiene todos los caracteres de la página de códigos US-ASCII.
Informatica considera que una página de códigos es un superconjunto de sí misma y todas las demás páginas de códigos compatibles.
Subconjunto. Una página de códigos es un subconjunto de otra página de códigos cuando todos los caracteres de la página de códigos están también codificados en la otra página de códigos. Por ejemplo, US-ASCII es un subconjunto de MS Latin1 porque todos los caracteres de la página de códigos US-ASCII están también codificados en la página de códigos MS Latin1.
Para que el movimiento de datos sea preciso, la página de códigos de destino debe ser un superconjunto de la página de códigos de origen. Si la página de códigos de destino no es un superconjunto de la página de códigos de origen, el servicio de integración de PowerCenter puede no procesar todos los caracteres, por lo que pueden perderse datos o resultar incorrectos. Por ejemplo, Latin1 es un superconjunto de US-ASCII. Si selecciona Latin1 como página de códigos de origen y US-ASCII como página de códigos de destino, pueden perderse datos de caracteres si el origen contiene caracteres no incluidos en US-ASCII.
Cuando se instala o actualiza un servicio de integración de PowerCenter para que se ejecute en modo Unicode, es preciso garantizar la compatibilidad de las páginas de códigos entre la base de datos de configuración del dominio, Administrator Tool, los clientes de PowerCenter, los nodos de proceso de servicio de integración de PowerCenter, el repositorio de PowerCenter, el repositorio de Metadata Manager y los equipos que hospedan
pmrep
y
pmcmd
. En el modo Unicode, el servicio de integración de PowerCenter fuerza la compatibilidad entre las páginas de códigos del cliente de PowerCenter y el repositorio de PowerCenter y entre el proceso de servicio de integración de PowerCenter y el repositorio de PowerCenter. Además, cuando se ejecuta el servicio de integración de PowerCenter en modo Unicode, las páginas de códigos asociadas a las sesiones deben tener las relaciones correspondientes:
Para cada origen de la sesión, la página de códigos de origen debe ser un subconjunto de la página de códigos de destino. El servicio de integración de PowerCenter no requiere compatibilidad entre las páginas de códigos del origen y el proceso de servicio de integración de PowerCenter o entre el proceso de servicio de integración de PowerCenter y el destino.
Si la sesión contiene una transformación de búsqueda o de procedimiento almacenado, la página de códigos de la base de datos o del archivo debe ser un subconjunto del destino que recibe los datos de la transformación de búsqueda o procedimiento almacenado y un superconjunto del origen que proporciona datos a la transformación de búsqueda o procedimiento almacenado.
Si la sesión contiene una transformación de procedimiento externo o personalizada, el procedimiento debe pasar los datos en una página de códigos que sea un subconjunto de la página de códigos de destino para los destinos que reciben datos de la transformación de procedimiento externo o personalizada.
Informatica usa páginas de códigos para los componentes siguientes:
Base de datos de configuración del dominio. La base de datos de configuración del dominio debe ser compatible con las páginas de códigos del repositorio de PowerCenter y el repositorio de Metadata Manager.
Administrator Tool. Los datos se introducen en cualquier idioma en Administrator Tool.
Cliente de PowerCenter. Los datos se introducen en cualquier idioma en el cliente de PowerCenter.
Proceso de servicio de integración de PowerCenter. El servicio de integración de PowerCenter puede mover datos en los modos ASCII y Unicode. El modo de movimiento de datos predeterminado es ASCII, que pasa datos de caracteres ASCII de 7 bits o de 8 bits. Para pasar datos de caracteres multibyte de orígenes a destinos, se usa el modo de movimiento de datos Unicode. Cuando se ejecuta el servicio de integración de PowerCenter en modo Unicode, se usan hasta tres bytes para cada carácter para mover los datos y se realizan comprobaciones adicionales en el nivel de sesión para garantizar la integridad de los datos.
Repositorio de PowerCenter. El repositorio de PowerCenter puede almacenar datos en cualquier idioma. Puede usar la página de códigos UTF-16LE para el repositorio de PowerCenter para almacenar datos multibyte en dicho repositorio. La página de códigos del repositorio de PowerCenter es la misma que la página de códigos de la base de datos.
Repositorio de Metadata Manager. El repositorio de Metadata Manager puede almacenar datos en cualquier idioma. Puede usar la página de códigos UTF-16LE para el repositorio de Metadata Manager para almacenar datos multibyte en el repositorio. La página de códigos del repositorio es la misma que la página de códigos de la base de datos.
Orígenes y destinos. Los orígenes y destinos almacenan datos en uno o más idiomas. Las páginas de códigos se usan para especificar el tipo de caracteres de los orígenes y destinos.
Programas de la línea de comandos de PowerCenter. Debe asegurarse también de que la página de códigos de
pmrep
sea un subconjunto de la página de códigos del repositorio de PowerCenter y de que la página de códigos de
pmcmd
sea un subconjunto de la página de códigos del proceso de servicio de integración de PowerCenter.
La mayoría de los servidores de base de datos usan dos páginas de códigos, una página de códigos de cliente para recibir los datos desde las aplicaciones cliente y una página de códigos de servidor para almacenar los datos. Cuando se ejecuta el servidor de base de datos, éste convierte los datos entre las dos páginas de códigos si son diferentes. En este tipo de configuración de base de datos, el proceso de servicio de integración de PowerCenter interactúa con la página de códigos del cliente de base de datos. Por lo tanto, las páginas de códigos que usa el proceso de servicio de integración de PowerCenter, como las páginas de códigos del repositorio de PowerCenter, de origen o de destino, deben ser idénticas a la página de códigos del cliente de base de datos. La página de códigos del cliente de base de datos suele ser idéntica a la página de códigos del sistema operativo en el que se ejecuta el proceso de servicio de integración de PowerCenter. La página de códigos del cliente de base de datos es un subconjunto de la página de códigos del servidor de base de datos.
Para obtener más información sobre las páginas de códigos específicas del cliente y servidor de base de datos, consulte la documentación de la base de datos.
El servicio de informes no requiere que se especifique una página de códigos para los datos almacenados en el repositorio de Data Analyzer. Administrator Tool escribe la información del dominio, usuarios y grupos en el servicio de informes. Sin embargo, los controladores de DataDirect realizan las conversiones de datos necesarias.