Técnicas y herramientas para diseño lógico y mantenimiento de data warehouses relacionales


Proyecto financiado por la CSIC - Universidad de la República

Julio 2000 - Junio 2002

Resumen

Un elemento importante (aceptado desde mediados de la década del 90) en la infraestructura de un sistema de información para la toma decisiones de una organización de gran porte es lo que en ingles se conoce como data warehouse (DW). Un DW contiene datos e indicadores obtenidos de las bases de datos operacionales mediante procesos tales como la integración y el control de la calidad de datos y almacenados en estructuras que permiten, en particular, un acceso eficiente a las consultas OLAP (Online Analytical Processing) que satisfacen una parte de los requerimientos de toma de decisiones. Ejemplos típicos de requerimientos OLAP en el área de negocios lo constituyen la generación dinámica de reportes que calculan y hacen ranking de las ventas totalizadas por diferentes variables como pueden ser el cliente, el país y/o el año.

Considerando a un DW como una jerarquía de bases de datos, en este proyecto nos concentramos en la base de datos conocida como DW corporativo. Los DW corporativos son utilizados como depósitos intermedios para facilitar las tareas y separar el procesamiento entre las bases operacionales y las bases finales usadas por las herramientas orientadas al usuario final. Los DW corporativos habitualmente incluyen indicadores ya calculados para acelerar y simplificar la carga del próximo nivel en la jerarquía de bases de datos y sus datos se obtienen periódicamente a partir de las bases operacionales. Los DW corporativos relacionales (basados en el modelo relacional como modelo de datos) constituyen la opción más difundida.

Las técnicas de gestión de bases de datos para DW corporativos han evolucionado en forma significativa y rápida. Estas técnicas brindan principalmente funcionalidades de almacenamiento apropiado y procesamiento eficiente de consultas. Sin embargo, pocas han sido las técnicas de diseño de la estructura de los DW corporativos que han acompañado a estas técnicas de gestión. Las características de un DW corporativo relacional hacen que las técnicas de diseño a utilizar sean diferentes de aquellas utilizadas en el diseño de bases de datos operacionales relacionales. En particular deben permitir trabajar con redundancia en los datos y definir y mantener el DW corporativo a partir de bases de datos operacionales ya existentes.

El proyecto aborda problemas de diseño y mantenimiento de data warehouses corporativos relacionales. Se definieron técnicas y se incorporaron en una herramienta de software para resolver principalmente los problemas de definición del esquema del DW corporativo y la gestión de su evolución. El enfoque de la solución se basa en el uso de primitivas de transformación de esquemas. Estas operaciones permiten por un lado, representar conocimiento de criterios de diseño para llegar al esquema final a partir de los esquemas fuentes y por otro lado, proveer la traza del diseño realizado para ser utilizada en la gestión de la evolución.

Integrantes


Publicaciones


Reportes Técnicos


Reportes Internos


Ponencias


Difusión


Seminario


Informes de avance


Trabajos relacionados