Título: Extracción Automática de Valores de Calidad de Datos
Marco de Trabajo: Proyecto de Grado
Área de desarrollo: Sistemas de Información
Autor: Simón de Uvarow
Contacto: sduvarow@fing.edu.uy
Día: MIERCOLES
Hora: 08:30
Palabras Claves: Calidad de Datos, Ontologia, Reglas SWRL
Resumen:
Tutor Regina Motz
La calidad de los datos utilizados en un sistema de información está altamente condicionada por la calidad de los datos extraídos desde las fuentes de información que ese sistema utiliza. Esto además con la característica extra, de que la calidad de los datos en las fuentes de información varía generalmente de forma muy dinámica. Esta característica es especialmente sensible en fuentes Web dada su gran volatilidad.
Este trabajo atiende esta problemática, presentando una propuesta de medición de calidad de datos de páginas Web.
La información de calidad de los datos extraídos es luego utilizada para decidir desde qué fuente obtener un dato para resolver la carga de un Web DataWarehouse [1].
Se diseñó una ontología OWL [9] de factores de calidad que modela también las diferentes métricas que se pueden aplicar a cada factor a través de reglas SWRL [13].
Se presenta una implementación del sistema y un caso de estudio junto con algunas experimentaciones.
|