Loading...

Diplomatura en Cloud Data Engineering – Módulo Foundations y Cloud Architect

ÁREA

TIC

MODALIDAD

A Distancia

ESTADO

Cursando

REUNIÓN INFORMATIVA

-

INICIO / FINALIZACIÓN

22 / 09 / 2020 al 03 / 12 / 2020

En la actualidad, las empresas que realizan sistemas de Machine Learning dedican entre el 80 y 90% del tiempo total del proyecto a la preparación de los datos, automatización de los procesos, salida productiva, monitoreo de la solución y evolución de la misma para lograr una implementación exitosa.

Si bien el conocimiento de Machine Learning y estadística es crucial, la mayoría de los skills involucrados en este proceso son específicos y se asemejan mucho a cómo se administra un proceso aunque con un sesgo específico al mundo de los datos.

A medida que crece la demanda en las empresas por soluciones que involucren analítica avanzada, optimización, Machine Learning y Cloud Computing, cada vez toma más relevancia el perfil de Data Engineer y Data Architect.

Objetivos y outcomes:

Formar perfiles en habilidades técnicas enfocadas en el desarrollo de sistemas de datos con Python, Cloud Computing, fundamentos de Ingeniería de Datos y Machine Learning. El enfoque tendrá un fuerte componente práctico que les permita desempeñarse a un alto nivel en el área de datos de cualquier empresa.

Debido a la demanda de infraestructura y agilidad que implican este tipo de sistemas resulta vital implementar los mismos sobre ambientes de Cloud Computing.

El alumno deberá ser capaz de construir soluciones de datos end-to-end sobre entornos Cloud (principalmente Amazon Web Services) desarrollando experiencia en las mejores prácticas para este tipo de sistemas y entornos.

Dirigido a:

Profesionales con experiencia en programación que quieran desempeñarse en el mundo de los datos, especialmente en los procesos de Arquitectura Cloud y construcción de procesos que involucren datos, más conocidos como “data pipelines,” y sistemas de Machine Learning.

¿Querés conocer más sobre el programa?

Mirá el resumen de la charla informativa 2020

Plan de estudios

La primera parte del curso, Foundations, cubre los temas que debe conocer el alumno antes de comenzar a explorar los temas centrales de la Diplomatura. Incluye introducción a lenguaje Python, sistema operativo Linux y bases de datos. La segunda parte del curso, Cloud Architect, enseña a los participantes los temas de arquitectura de soluciones que pueden enfrentarse en la ejecución de proyectos en empresas o de forma particular. Se verán los temas que son necesarios para rendir el examen de AWS Solutions Architect – Associate, incluyendo framework general, Compute, Storage, Networking, Databases, etc.
Temario:

Introducción al lenguaje Python
Introducción al sistema operativo Linux
Introducción a base de datos (PostgreSQL)
Introducción a Cloud, Infraestructura y Cloud Adoption Framework
Compute
Storage
Networking
Databases
Cloud Economics & Support
Security
Scaling, Monitoring & Well Architected Framework
Queues (SQS), Notificaciones (SNS), Workflows (SWF), Batch, Cachés (Memcached, Redis)
Networking en profundidad (ENI, EFA, Route53)
Scalability & Resilience en profundidad (observabilidad, API Gateways, Lambda)
Streams (Kinesis, Kafka)

En este curso los participantes aprenderán y utilizarán Python para el desarrollo de aplicaciones de datos. El curso comienza con un foco en técnicas modernas de software engineering y data engineering. Luego, se formarán en conceptos y herramientas de Machine Learning para poder desarrollar modelos y estar preparados para desarrollar en el siguiente curso los data pipelines y sistemas de Machine Learning.
Temario:

Introducción al desarrollo de aplicaciones de datos con Python
a. Desarrollo de aplicaciones: manejo de Visual Studio Code, manejo de dependencias, versionado de código, debugging, armado de paquetes.
b. Testing
c. Introducción a las librerías de datos Numpy y Pandas.
d. Interacción con APIs y Bases de Datos.
e. Scheduling básico de procesos con Apache Airflow y Docker.
f. Intro a Apache Spark para implementación de pipelines.
Machine Learning Aplicado con Python
a. Introducción a la librería Scikit-Learn.
b. Ejemplos de clasificación y regresión en conjunto con visualización con Matplotlib y Seaborn y utilizando pipelines de scikit.
c. Participación de competencias de Kaggle.
d. Forecasting de series de tiempo.

Este módulo se dictará en el 2021.

En este curso se verán conceptos y herramientas que son necesarias para la ingesta, procesamiento y ordenamiento para lograr data warehouses y data lakes. Luego se continúa con la preparación de los datos y el posterior desarrollo de sistemas basados en Machine Learning utilizando los datos del pipeline anteriormente construido.
El curso culmina con un TP Final que involucra la puesta en práctica de los conceptos aprendidos para implementar una arquitectura Cloud que combine los conocimientos de Data Engineering, Cloud Architecture y Machine Learning aprendidos a lo largo del programa.
Temario:

Cloud ML Engineering
a. Arquitecturas modernas de datos sobre Amazon Web Services (batch y streaming).
b. Pipeline de Data Engineering y Data Science sobre AWS.
c. Desarrollo de un sistema de ML: training, cross validation, hyperparameter tuning, etc.
Proyecto Final
a. Los alumnos deberán desarrollar un proyecto que involucre construir una infraestructura sobre AWS y combinar los conocimientos adquiridos en los 3 cursos principales del programa.

Este módulo se dictará en el 2021.

Cuerpo docente

● Ingeniero en Informática del ITBA y Profesor en grado y posgrado de la misma institución.
● Más de 10 años implementando sistemas de Big Data y Data Engineering.
● Trabajó y lideró proyectos de Big Data en Globant (Google), Despegar, Socialmetrix y Jampp.
● Profesor de postgrado ITBA desde 2015 en temas de Big Data.
● Co-Founder de Mutt Data, una empresa enfocada en la consultoría y desarrollo de sistemas de datos para empresas de tecnología combinando skills y herramientas de Big Data y Machine Learning.

● Licenciado en Administración y Sistemas de ITBA, profesor en grado y postgrado de la institución en materias de Arquitectura de Tecnología y Cloud Computing
● Más de 15 años de experiencia en el mundo de la tecnología, negocios e innovación.
● Actualmente CCO de Drixit Technologies, empresa de IIOT y Big Data, y Director de la carrera de la Licenciatura en Administración y Sistemas en ITBA.
● Previamente trabajó en MURAL realizando tareas de Data Engineering, SecOps, Compliance y Analítica.

● Consultor en desarrollo de negocios con extensa experiencia en empresas y emprendimientos de tecnología y telecomunicaciones.
● MBA de la University of Michigan e Ingeniero Industrial del ITBA donde se desempeña como profesor de grado, posgrado y miembro del Comité Organizador del 100K Latam

● Ingeniero en Informatica ITBA
● Especialización en Ciencia de Datos ITBA
● Site Reliability Engineer y Data Scientist en Chevron por más de 8 años.
● Actualmente Data Scientist en J.P. Morgan Chase.
● Paper publicado en 2019 sobre Optimización de agenda de trabajos de pozo mediante el uso de algoritmos genéticos para Chevron Nigeria (SPE-198821-MS).

Modalidad

El curso será de manera totalmente online con clases sincrónicas y partes asincrónicas. Será fundamentalmente práctico, donde los alumnos deberán resolver desafíos de manera autónoma con soporte de los docentes.

Modalidad de cursada para Módulo 1: Foundations y Cloud Architect

1. Inicio: 22 de septiembre
2. Fin: 3 de diciembre
3. Duración en semanas: 11 semanas
4. Duración en cantidad de horas: 64
5. Horas sincrónicas: 31.5
6. Horas asincrónicas: 32.5
7. Tutorías /Clases de consulta: 9 horas – Lunes de 18 a 19:30 hs.
7. Días de cursada: Martes y jueves
8. Horario de cursada: 18:00 a 19:30 hs.

  • Por realizar el módulo Foundations y Cloud Architect, el ITBA brinda el beneficio de acceder a un 50% de descuento en la certificación AWS.
  • El módulo Foundations y Cloud Architect forma parte de la Diplomatura en Cloud Data Engineering que se realizará en el 2021.

Cierre de Inscripción: 17 de septiembre

Para inscribirte, enviá tu consulta desde nuestro formulario o comunicate por teléfono al (011) 3754 – 4848 / 4843