Seleccionar página

Proyectos

Centro de Informática

Proyecto: PICT 2017 – 1054

Título: Diseño e Implementación de Herramientas para la Administración y Análisis de la Evolución de Datos Complejos en Big Data utilizando Bases de Datos de Grafos

Descripción

Los nuevos paradigmas de análisis de datos deben poder manejar no solamente datos alfanuméricos, sino que también se debe dar soporte a operaciones sobre datos de diverso tipo, por ejemplo, geográficos, imágenes satelitales rasterizadas, datos multimediales (audio/video), información no estructurada en redes sociales, entre otros. Estos nuevos tipos de datos se caracterizan por su naturaleza no-relacional, y, fundamentalmente, por su conectividad, que ha venido creciendo exponencialmente, impulsada por diversas iniciativas y aplicaciones. Los grafos son posiblemente la mejor estructura de datos para representar la inmensa red de conexiones que subyacen a las aplicaciones y problemas mencionados anteriormente. Es por ello que el uso de las bases de datos de grafos (un caso particular de tecnología NoSQL) como solución al problema de almacenar y analizar estos enormes grafos ha venido ganando espacio consistentemente.

La dimensión temporal está presente en la mayoría de los problemas y aplicaciones que mencionamos anteriormente. Como un ejemplo bien conocido, los grafos que representan redes sociales evolucionan permanentemente en el tiempo (como en los casos en los que se agregan y quitan amigos, o se modifican preferencias). El análisis de esta información temporal (ya sea para efectuar minería de datos, sumarizaciones, etc.), requiere herramientas que permitan administrarla, consultarla, analizarla y visualizarla eficientemente. Sorprendentemente, a pesar de la relevancia de este problema, la comunidad de bases de datos no le ha prestado, hasta el momento, la suficiente atención al tema. Este proyecto pretende ocupar ese espacio, desarrollando técnicas y modelos que permitan integrar, publicar, vincular, consultar, analizar y visualizar la evolución de grandes volúmenes de datos representados en forma de grafos variantes en el tiempo, y aplicar la solución a casos de estudio reales donde soluciones tradicionales no resultan eficaces.