Sergio Luján Mora

Profesor Titular de Universidad

Diagramas de mapeo de atributos para el diseño de almacenes de datos con UML

Sergio Luján-Mora, Juan Trujillo, Panos Vassiliadis
IX Jornadas de Ingeniería del Software y Bases de Datos (JISBD'2004), p. 61-72, Málaga (Spain), November 10-12 2004.
(JISBD'04) Congreso nacional / National conference

Resumen

En el entorno de los almacenes de datos (ADs), se conoce como ETL (Extraction, Transformation, Loading) a los procesos responsables de la extracción de los datos de las fuentes de datos heterogéneas, su transformación (conversión, limpieza, normalización, etc.) y su carga en el AD. Un aspecto crítico por resolver en el modelado de estos procesos ETL es el hecho de que los datos se tratan a unos niveles de granularidad muy bajos que incluyen la definición de reglas de transformación a nivel de atributos, no existiendo hasta el momento ninguna propuesta que nos permita una definición formal de tales transformaciones. En este artículo, extendemos el Lenguaje de Modelado Unificado (Unified Modeling Language, UML) con un nuevo diagrama denominado diagrama de mapeo de datos, el cual nos permite representar las reglas de transformación entre atributos necesarias para modelar los procesos ETL a nivel conceptual. Finalmente, y para facilitar su manejo, hacemos uso de los diagramas de paquetes de UML, obteniendo una propuesta que nos permite especificar los procesos ETL con diferentes niveles de detalle.

Descarga