Diplomado en Big data y machine learning
Matricúlate ahora y obtén un
25% dto.
(Precio final CLP $1.642.500)
Objetivos
ACLARA TUS DUDAS
Quisimos responder las preguntas que muchos nos hacen a través de este video.

Malla académica
Curso Técnicas de big data para machine learning
Profesor:
Gabriel Sepúlveda, Ph.D (c) Pontificia Universidad Católica de Chile Ver más...
Gabriel Sepúlveda, Ph.D (c) Pontificia Universidad Católica de Chile Ver más...
Plan de estudios
Clase en vivo
Un profesor ayudante interactúa directamente con un grupo reducido de participantes para ayudar a resolver problemas técnicos remanentes, como por ejemplo, relacionados con el uso del ambiente de desarrollo Google Colaboratory, con la instalación de herramientas Hadoop y Spark o con la utilización de la API para el almacenamiento y procesamiento de big data.
Trabajo individual
Los alumnos deben aplicar los conocimientos aprendidos en tres trabajos o pequeños proyectos concretos, los cuales tendrán por objetivo aplicar de forma práctica las técnicas y herramientas para el manejo de big data. En particular, se enfocan en el uso del ecosistema Hadoop, del framework Spark y su biblioteca para machine learning Spark MLLIB, y de herramientas prácticas para visualización de datos. El último proyecto suele tener características integradoras y, por lo tanto, es un poco más largo y completo que los anteriores. Aun cuando el trabajo se entrega en forma individual y no grupal, los alumnos pueden conversar y discutir sobre sus ideas de soluciones con sus compañeros, antes de desarrollar y entregar el proyecto.
Contenidos
Ecosistema Hadoop
- Introducción al big data
- El ecosistema Hadoop
- El sitema de archivos distribuidos Hadoop (HDFS)
- Presentación de ambiente de desarrollo web Google Colaboratory
- Aplicación práctica de herramientas de software
Herramientas del ecosistema Hadoop
- Hadoop MapReduce
- Manejo de bases de datos con herramienta de alto nivel e interfaz de tipo SQL (Apache Hive)
- Manejo de bases de datos sobre MapReduce con lenguaje de alto nivel (Apache Pig)
- Aplicación práctica de herramientas de software
Apache Spark
- Conceptos y usos
- Resilient Distributed Dataset
- Programación en Spark
- Transformaciones y acciones
- Aplicación práctica de funciones core de Spark
Data analytics con Apache Spark
- Apache Flume
- Módulo Spark Streaming
- Módulo Spark SQL
- Aplicación práctica en procesamiento de streams de datos
- Aplicación práctica en procesamiento de datos estructurados
Machine learning con Apache Spark
- Módulo Spark MLLIB
- Programación con funciones MLLIB con datasets supervisados
- Programación con funciones MLLIB con datasets no supervisados
- Pipelines de extracción de datos, entrenamiento y predicción con Spark ML
- Aplicación práctica de Spark en machine learning
Técnicas de visualización
- Conceptos fundamentales de visualización de información
- Funciones básicas de Matplotlib
- Reducción de dimensionalidad
- Aplicación práctica de herramientas de software
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Curso Aplicaciones de machine learning y ciencia de datos
Profesor:
Jaime Navón Cohen, Ph.D University of North Carolina at Chapel Hill (Estados Unidos) Ver más...
Jaime Navón Cohen, Ph.D University of North Carolina at Chapel Hill (Estados Unidos) Ver más...
Plan de estudios
Clase en vivo
Un profesor ayudante interactúa directamente con un grupo reducido de participantes para presentar un caso real de aplicación de machine learning y ciencia de datos, haciendo énfasis en la oportunidad, solución, dificultades y beneficios, para luego discutir con el grupo y responder consultas.
Trabajo Grupal
Los alumnos deben aplicar los conocimientos aprendidos en tres trabajos o pequeños proyectos concretos. En particular, el primer trabajo se enfoca en desarrollar la capacidad de identificar los conceptos básicos de machine learning y ciencia de datos en los casos de estudio presentados. El segundo trabajo busca desarrollar la capacidad de identificar la presencia y necesidad de los distintos tipos de aprendizaje en los casos de estudio presentados. Finalmente, el tercer trabajo pretende integrar ambas miradas en la formulación de un caso de estudio original, en el que sea posible identificar los conceptos básicos, los tipos de aprendizaje, además de la oportunidad, solución, dificultades y beneficios. Aun cuando el trabajo se entrega en forma individual y no grupal, los alumnos pueden conversar y discutir sobre sus ideas de soluciones con sus compañeros, antes de desarrollar y entregar el proyecto.
Contenidos
Conceptos básicos
- Inteligencia de negocios
- Minería de datos
- Ciencia de datos
- Machine learning
Aplicación en negocios por tipo de datos
- Transacciones estructuradas
- Texto
- Audio
- Imagen y video
Tipos de aprendizaje
- Supervisado
- No supervisado
- Reforzado
- GAN
Aplicaciones de los tipos de aprendizaje
- Supervisado
- No supervisado
- Reforzado
- GAN
Estudio de casos por tipo de datos
- Transacciones estructuradas
- Texto
- Audio
- Imagen y video
- Estudio de casos por Industria
- Seguros / banca / finanzas
- Sector industrial
- Retail y consumo
- Gobierno
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Curso Visualización de información en la era del big data
Profesor:
Denis Parra Santander, Ph.D University of Pittsburgh (EE.UU.)
Denis Parra Santander, Ph.D University of Pittsburgh (EE.UU.)
Plan de estudios
Clases en vivo
Un profesor ayudante interactúa directamente con un grupo reducido de participantes para ayudar a resolver problemas técnicos remanentes, como por ejemplo, la correcta instalación de herramientas de software, el uso apropiado de algunas herramientas, etc.
Para este curso se revisarán formas de interpretar y aplicar del modelo anidado de visualización para validar visualizaciones existentes y para justificar decisiones de diseño de nuevos gráficos de visualización de información. Se revisarán y aplicarán bibliotecas en Python especializadas en visualización. Y con participación de los alumnos se analizarán casos de visualización.
Trabajos individuales
Los participantes deben aplicar los conocimientos aprendidos en tres trabajos o pequeños proyectos concretos. La primera actividad práctica requiere utilizar los conceptos de visualización para evaluar y validar diseños de visualización de información ya existentes. La idea es poner en práctica la relación entre tipos de datos y datasets, tareas, así como conocer las marcas y canales más apropiados para codificar información visualmente. La segunda actividad práctica tiene como propósito implementar visualizaciones mediante programación. Se establecen tres casos con datasets y codificaciones objetivo, con lenguage Python y usando las bibliotecas Pandas, Matplotlib y Seaborn.
El último proyecto suele tener características integradoras y, por lo tanto, es un poco más largo y completo que los anteriores. Aun cuando el trabajo se entrega en forma individual y no grupal, los alumnos pueden conversar y discutir sobre sus ideas de soluciones con sus compañeros, antes de desarrollar y entregar el proyecto. De esta forma, la tercera actividad de aplicación requiere una integración de conceptos de visualización y de implementación en Python. Dado un dataset y un caso de estudio, el estudiante analiza un dataset y provee respuestas a ciertas preguntas a través de la implementación de diferentes visualizaciones. En el proceso, se justifican las decisiones de codificación visual (gráfico, colores, etc.) y del espacio de diseño en general.
Contenidos
Introducción a visualización de Información
- Ejemplos históricos de visualización de datos
- Conceptos fundamentales de visualización de información
- Percepción visual
- Funciones básicas de Matplotlib y Seaborn.
Modelo anidado de Munzner para diseño y validación de visualizaciones
- ¿Qué? Datos y datasets
- ¿Por qué? Tareas de visualización
- ¿Cómo? Codificación visual
- Reglas y recomendaciones generales para visualizaciones efectivas
Diseño e implementación de gráficos simples para datos tabulares usando modelo anidado
- Gráfico de barras y barras apiladas
- Gráfico de puntos y de líneas
- Gráfico de dispersión y de burbujas
- Gráfico de flujos
- Histogramas, gráficos de caja y de violín
Diseño e implementación de gráficos avanzados para datos tabulares usando modelo anidado
- Múltiples ejes, gráficos radiales y de torta
- Matriz de gráficos
- Pequeños múltiples
- Mapa de calor
- Reducción de dimensionalidad lineal y no lineal
Diseño e implementación de gráficos para datos de red usando modelo anidado.
- Conceptos de red, grafos y árboles
- Diagramas nodo-enlace
- Matrices de adyacencia
- Gráficos tipo encierro
- Clustermap
Visualización en diversos dominios de aplicación
- Introducción a la visualización en diversos dominios y a storytelling
- Visualizacion espacial y espacio-temporal
- Visualización de colecciones de documentos
- Visualización de vectores de palabras
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Curso Python para machine learning
Profesor:
Francisco Pérez Galarce, Ph.D (c) Pontificia Universidad Católica de Chile
Francisco Pérez Galarce, Ph.D (c) Pontificia Universidad Católica de Chile
Plan de estudios
Clase en vivo
Un profesor ayudante interactúa directamente con un grupo reducido de participantes para ayudar a resolver problemas técnicos remanentes, como por ejemplo, la correcta instalación de herramientas de software y el uso apropiado de algunas herramientas, además de apoyar el desarrollo de casos de estudio. Con estos últimos, se busca que los alumnos se vean enfrentados a situaciones más cercanas a la realidad, recorriendo las distintas etapas de los proyectos de machine learning.
Trabajo individual
Los alumnos deben aplicar los conocimientos aprendidos en tres pequeños proyectos cuyo objetivo es reforzar el aprendizaje teórico de las clases lectivas. El primer proyecto se focaliza en aplicar herramientas de preprocesamiento y visualización de datos. Los siguientes tienen características integradoras de preprocesamiento y aplicación de modelos de machine learning tanto en su versión supervisada como no supervisada. Aun cuando el trabajo se entrega en forma individual y no grupal, los alumnos pueden conversar y discutir sobre sus ideas de soluciones con sus compañeros, antes de desarrollar y entregar el proyecto.
Contenidos
Conceptos fundamentales de machine learning
- Definiciones básicas
- Tipos de aprendizaje de máquina
- Python
- Ecosistema Python para machine learning
Análisis, procesamiento y visualización de datos a través de Python
- Tipos de variables
- Análisis descriptivo de variables
- Transformación de variables
- Imputación de variables
- Visualización de variables
Aprendizaje supervisado I: Regresiones
- Regresión lineal
- Regresión logística
- Regresiones polinomiales
- Regresiones con penalización
Aprendizaje supervisado II: Clasificadores
- Evaluación de clasificadores
- Naive Bayes
- Árboles de decisión
- Random forest
Redes Neuronales
- Tecnologías de Python para deep learning
- Introducción a las redes neuronales
- Redes convolucionales
- Redes recurrentes
Algoritmos de aprendizaje no supervisado en Python utilizando scikit-learn
- K-means
- Mezcla gaussianas
- Cluster jerárquico
- Autoencoders
Clase Ejecutiva UC se reserva el derecho a modificar el contenido en cualquier momento.
Jefe de programa

Jaime Navón Cohen
Ph.D University of North Carolina at Chapel Hill (Estados Unidos)
Jaime Navón Cohen es Ph.D Computer Science, University of North Carolina at Chapel Hill (EE.UU.). Además tiene un Master of Science, Technion-Israel Institute of Technology (Israel). Es ingeniero civil electricista, Pontificia Universidad Católica de Chile (UC).
Asimismo, es profesor asociado del Departamento de Ciencia de la Computación de la UC.
Jefe de programa
Profesores

Denis Parra Santander
Ph.D University of Pittsburgh (EE.UU.)
Denis Parra Santander es Ph.D Computer Science, University of Pittsburgh (Pensilvania, EE.UU). Además, es ingeniero civil en Informática, Universidad Austral de Chile. Actualmente, se desempeña como profesor asociado del Departamento de Ciencia de la Computación de la Pontificia Universidad Católica de Chile.

Francisco Pérez Galarce
Ph.D (c) Pontificia Universidad Católica de Chile
Francisco Pérez Galarce es Ph.D (c) in Computer Science, Pontificia Universidad Católica de Chile. También es magíster en Gestión de Operaciones e ingeniero civil industrial, Universidad de Talca. Es Head of Advanced Analytics en BRAVE UP!

Gabriel Sepúlveda
Ph.D (c) Pontificia Universidad Católica de Chile
Gabriel Sepúlveda es Ph.D (c) en Ciencias de la Ingeniería área Ciencia de la Computación, Pontificia Universidad Católica de Chile (UC). Además, es ingeniero civil electrónico, con mención en Control Automático y Mención Complementaria en Computadores, Universidad Técnica Federico Santa María (Chile). Se desempeña como profesor instructor del Departamento de Ciencia de la Computación, Escuela de Ingeniería de la UC.

Iván Lillo
Doctor Pontificia Universidad Católica de Chile
Iván Lillo es doctor en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile (UC). Además tiene un Magíster en Ciencias de la Ingeniería, UC, y es ingeniero civil electricista, UC. Se desempeña como profesor instructor del Departamento de Ciencia de la Computación, Escuela de Ingeniería de la UC.

Jaime Navón Cohen
Ph.D University of North Carolina at Chapel Hill (Estados Unidos)
Jaime Navón Cohen es Ph.D Computer Science, University of North Carolina at Chapel Hill (EE.UU.). Además tiene un Master of Science, Technion-Israel Institute of Technology (Israel). Es ingeniero civil electricista, Pontificia Universidad Católica de Chile (UC). Asimismo, es profesor asociado del Departamento de Ciencia de la Computación de la UC.
Jefe de programa

Patricio Cofré
Máster Northwestern University (EE.UU.)
Patricio Cofré tiene un Master of Engineering Management, Northwestern University (Chicago, EE.UU.). También es magíster en Ciencias de Ingeniería de la Pontificia Universidad Católica de Chile (UC) e ingeniero eléctrico UC. Además, es diplomado en Data Science de University of Columbia y Professional Certification en Data Science de John Hopkins. Es cofundador de Metric Arts, ahora parte de EY.
Ventajas


