Loading...

Diplomatura en Big Data

ÁREA

TICS

MODALIDAD

A Distancia

ESTADO

Cursando

REUNIÓN INFORMATIVA

-

INICIO / FINALIZACIÓN

27 / 07 / 2020 al 04 / 12 / 2020

Alejandro Vaisman
DIRECTOR

Big data se refiere a las grandes colecciones de datos, estructurados, o no estructurados,  que pueden crecer a volúmenes enormes y a un ritmo tan alto que es complejo manejarlos con las técnicas habituales de los sistemas de bases de datos y las  herramientas de análisis existentes hasta hace un tiempo.

La gestión y el análisis de estas cantidades masivas de datos exigen nuevas soluciones que van más allá de los procesos tradicionales o herramientas de software habituales en la práctica diaria, lo que ha llevado a acuñar el término “big data analytics”.

plan de estudios

Contenidos mínimos. Conceptos básicos de Data Mining. Modelos descriptivos y predictivos. Técnicas fundamentales: clasificación, clustering, patrones. Árboles de decisión. Aplicación a problemas concretos de predicción. Casos de estudio. KPIs (Key Performance Indicators). Redes Neuronales.

Contenidos  mínimos: Modelos de datos. Arquitecturas. Diseño conceptual, lógico y físico. El modelo multidimensional:  estrella, snowlflake y constellation.  Slowly changing dimensions. Diseño físico.  On Line Analytical Processing: OLAP. OLAP vd OLTP. Lenguajes de consulta: MDX básico y avanzado. SQL/OLAP: funciones de ventana. Entornos avanzados para OLAP. Bases de datos de grafos y OLAP.

Contenidos  mínimos: Conceptos fundamentales de Big Data.  Datos estructurados y no estructurados. El paradigma MapReduce. Hadoop File System, HadoopDB.  Lenguages de alto niveL: HiveQL y Pig Latin.   Google Cloud SQL. Google Big Table. Utilizacion en data Warehousing. Análisis de datos con Hadoop y Hive.

Contenidos mínimos. Contenidos mínimos. Introducción, definiciones, antecedentes, gráficos notables. Principios de la excelencia gráfica. Observaciones y variables. Tipo de variables. Visualizando tablas, jerarquías y redes. Utilización del color. GIS. Representación eficiente de la información, sumarización y visualización de grandes volúmenes de datos. Prácticas con d3js, jit, Processing, Google Visualization API, Tableau, Fusion Tables y QGIS.

Cuerpo docente

Doctor en Ciencias de la Computación por la Universidad de Buenos Aires. Postdoctorado en la Universidad de Toronto, Canadá. Es especialista en Data Warehousing y Business Intelligence (BI), Data Mining, Sistemas de Información Geográfica (GIS), y en publicación de datos en la web, siguiendo los lineamientos de Linked Open Data. Co-autor, junto con el Prof. Esteban Zimányi (Universidad Libre de Bruselas) del libro “Data Warehouse Systems: Design and Implementation”. Ha publicado, además, 5 capítulos en libros internacionales y ha publicado artículos en las más prestigiosas revistas y conferencias de la especialidad.

 
Doctora en Ciencias de la Computación de la Universidad de Buenos Aires, especialista en Inteligencia Artificial y Robótica. Cuenta con +15 años de experiencia en empresas e instituciones llevando a cabo proyectos de consultoría en tecnología de la información e IA aplicada a la industria. Ha realizado conferencias en eventos nacionales e internacionales y charlas TED, como TEDxRosario, y TEDxBarcelona. Tiene publicados trabajos de investigación en IA. Es, además, docente universitaria en IA, Robótica, Data Mining, Machine Learning, y Redes Neuronales. También reliza tareas de divulgación científica, entre ellas, fue columnista de Robótica en  Radio Palermo, y jurado en el programa de ciencia de TV Eureka de Canal Encuentro.

Graduado de la carrera de  Ingeniería Informática en el ITBA, donde realizó su proyecto final de carrera utilizando herramientas de Big Data. Participó en proyectos de Big Data tanto en Google (a través de Globant), Despegar.com y Socialmetrix utilizando herramientas como Sqoop, Pig, Hbase, Hive, Oozie, Spark y Cassandra. Es docente del ITBA, y actualmente  desarrolla  la infraestructura de procesamiento de datos de Real-Time Bidding de ads y tracking de eventos de aplicaciones mobile en la empresa  Jampp.

Licenciado en Ciencias de la Computación, Depto de Computación, FCEyN, UBA. 25 años de experiencia docente (Inteligencia Artificial, Sistemas Expertos, Data Mining y Visualización de Información, 10 años como consultor independiente en las siguientes áreas: Spatial Databases, GIS, Data Quality, InfoVis y BI. Se desempeñó también como responsable de desarrollos GIS en diferentes organizaciones.

modalidad

La modalidad de cursada es virtual, el programa tiene una duración de 119 horas entre clases en vivo y actividades asincrónicas.

Se facilitará el día del inicio material de nivelación y el lunes 3 de agosto y el jueves 6 de agosto de 18:30 a 20:00 hs. se realizarán 2 clases de consultas en vivo en relación a ese material.

Los clases on line serán los martes y viernes de 18:00 a 21:30 hs. desde el 11 de agosto hasta el 6 de noviembre.

Del 11 de noviembre al 4 de diciembre las clases en vivo se dictarán los días miércoles y viernes de 18:00 a 21:30 hs.

Los días miércoles de 19 a 20 hs. se realizarán clases de consulta (optativas) para quienes necesiten reforzar conceptos.

Debido a la didáctica que requiere el curso, su realización queda sujeta a un mínimo de participantes.

Cierre de Inscripción: miércoles 22 de julio

Para inscribirte enviá tu consulta desde nuestro formulario o comunicate al (011) 3754-4848/4843