Loading...

Diplomatura en Big Data

ÁREA

TICS

MODALIDAD

Presencial

ESTADO

Cursando

REUNIÓN INFORMATIVA

-

INICIO / FINALIZACIÓN

17 / 04 / 2020 al 29 / 08 / 2020

INFORMACIÓN IMPORTANTE: Debido al contexto actual relativo al coronavirus, el inicio de la Diplomatura será bajo la modalidad online. Realizaremos de manera virtual las clases necesarias en tanto la situación persista, luego se continuará de manera presencial.

Alejandro Vaisman
DIRECTOR

Big data se refiere a las grandes colecciones de datos, estructurados, o no estructurados,  que pueden crecer a volúmenes enormes y a un ritmo tan alto que es complejo manejarlos con las técnicas habituales de los sistemas de bases de datos y las  herramientas de análisis existentes hasta hace un tiempo.

La  gestión y el análisis de estas cantidades masivas de datos exigen nuevas soluciones que van más allá de los procesos tradicionales o herramientas de software habituales en la práctica diaria, lo que ha llevado a acuñar el término “big data analytics”.

plan de estudios

Contenidos mínimos. Conceptos básicos de Data Mining. Modelos descriptivos y predictivos. Técnicas fundamentales: clasificación, clustering, patrones. Árboles de decisión. Aplicación a problemas concretos de predicción. Casos de estudio. KPIs (Key Performance Indicators). Redes Neuronales.

Contenidos  mínimos: Modelos de datos. Arquitecturas. Diseño conceptual, lógico y físico. El modelo multidimensional:  estrella, snowlflake y constellation.  Slowly changing dimensions. Diseño físico.  On Line Analytical Processing: OLAP. OLAP vd OLTP. Lenguajes de consulta: MDX básico y avanzado. SQL/OLAP: funciones de ventana. Entornos avanzados para OLAP. Bases de datos de grafos y OLAP.

Contenidos  mínimos: Conceptos fundamentales de Big Data.  Datos estructurados y no estructurados. El paradigma MapReduce. Hadoop File System, HadoopDB.  Lenguages de alto niveL: HiveQL y Pig Latin.   Google Cloud SQL. Google Big Table. Utilizacion en data Warehousing. Análisis de datos con Hadoop y Hive.

Contenidos mínimos. Contenidos mínimos. Introducción, definiciones, antecedentes, gráficos notables. Principios de la excelencia gráfica. Observaciones y variables. Tipo de variables. Visualizando tablas, jerarquías y redes. Utilización del color. GIS. Representación eficiente de la información, sumarización y visualización de grandes volúmenes de datos. Prácticas con d3js, jit, Processing, Google Visualization API, Tableau, Fusion Tables y QGIS.

Cuerpo docente

Doctor en Ciencias de la Computación por la Universidad de Buenos Aires. Postdoctorado en la Universidad de Toronto, Canadá. Es especialista en Data Warehousing y Business Intelligence (BI), Data Mining, Sistemas de Información Geográfica (GIS), y en publicación de datos en la web, siguiendo los lineamientos de Linked Open Data. Co-autor, junto con el Prof. Esteban Zimányi (Universidad Libre de Bruselas) del libro “Data Warehouse Systems: Design and Implementation”. Ha publicado, además, 5 capítulos en libros internacionales y ha publicado artículos en las más prestigiosas revistas y conferencias de la especialidad.

 
Doctora en Ciencias de la Computación de la Universidad de Buenos Aires, especialista en Inteligencia Artificial y Robótica. Cuenta con +15 años de experiencia en empresas e instituciones llevando a cabo proyectos de consultoría en tecnología de la información e IA aplicada a la industria. Ha realizado conferencias en eventos nacionales e internacionales y charlas TED, como TEDxRosario, y TEDxBarcelona. Tiene publicados trabajos de investigación en IA. Es, además, docente universitaria en IA, Robótica, Data Mining, Machine Learning, y Redes Neuronales. También reliza tareas de divulgación científica, entre ellas, fue columnista de Robótica en  Radio Palermo, y jurado en el programa de ciencia de TV Eureka de Canal Encuentro.

Graduado de la carrera de  Ingeniería Informática en el ITBA, donde realizó su proyecto final de carrera utilizando herramientas de Big Data. Participó en proyectos de Big Data tanto en Google (a través de Globant), Despegar.com y Socialmetrix utilizando herramientas como Sqoop, Pig, Hbase, Hive, Oozie, Spark y Cassandra. Es docente del ITBA, y actualmente  desarrolla  la infraestructura de procesamiento de datos de Real-Time Bidding de ads y tracking de eventos de aplicaciones mobile en la empresa  Jampp.

Licenciado en Ciencias de la Computación, Depto de Computación, FCEyN, UBA. 25 años de experiencia docente (Inteligencia Artificial, Sistemas Expertos, Data Mining y Visualización de Información, 10 años como consultor independiente en las siguientes áreas: Spatial Databases, GIS, Data Quality, InfoVis y BI. Se desempeñó también como responsable de desarrollos GIS en diferentes organizaciones.

modalidad

La modalidad de cursada es presencial, debido al contexto actual relativo al coronavirus, realizaremos de manera virtual las clases necesarias hasta que la situación persista, luego se continuará de manera presencial los viernes de 18:30 a 21:30 y sábados de 9:00 a 13:00, en 25 de mayo 444 ( CABA). Tiene una duración total de 119 horas.

Para inscribirte enviá tu consulta desde nuestro formulario o comunicate al (011) 3754-4848/4843