Overview
Este programa en ciencia de datos te permite conocer y desarrollar las principales habilidades técnicas para aportar como miembro de un equipo en un proyecto de ciencia de datos. Estas habilidades cada vez son más apetecidas por el mercado y es por ello que nuestros temas incluyen conocimientos básicos en modelos descriptivos basados en estadística, modelos predictivos basados en aprendizaje de máquina, y técnicas para integrar, explorar y preparar datos, tanto estructurados como no estructurados, utilizando el lenguaje de programación Python y librerías de manipulación y análisis de datos.
Syllabus
Course 1: Introducción a la ciencia de datos aplicada
- Offered by Universidad de los Andes. Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante ... Enroll for free.
Course 2: Modelos predictivos con aprendizaje automático
- Offered by Universidad de los Andes. Este curso te va a brindar conocimientos, tanto teóricos como prácticos, para que puedas construir ... Enroll for free.
Course 3: Integración y preparación de datos
- Offered by Universidad de los Andes. El manejo de datos que permita generar conocimiento útil para una organización es cada vez más ... Enroll for free.
- Offered by Universidad de los Andes. Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante ... Enroll for free.
Course 2: Modelos predictivos con aprendizaje automático
- Offered by Universidad de los Andes. Este curso te va a brindar conocimientos, tanto teóricos como prácticos, para que puedas construir ... Enroll for free.
Course 3: Integración y preparación de datos
- Offered by Universidad de los Andes. El manejo de datos que permita generar conocimiento útil para una organización es cada vez más ... Enroll for free.
Courses
-
Este curso te va a brindar conocimientos, tanto teóricos como prácticos, para que puedas construir modelos predictivos utilizando técnicas de aprendizaje automático (en inglés, machine learning). Estos modelos nos permiten anticipar en alguna medida eventos futuros y, en consecuencia, pueden ser utilizados para apoyar la toma de decisiones en las organizaciones y, en general, en cualquier dominio de aplicación. El curso consta de 4 módulos, cada uno de una semana, en los cuales vas a tener la oportunidad de conocer y analizar diferentes casos de estudio con el objetivo de que tengas un panorama amplio de las aplicaciones de los modelos predictivos. En el primer módulo estudiaremos algunos fundamentos del aprendizaje automático y te mostraremos ejemplos de proyectos que pueden ser realizados con estas técnicas. El segundo módulo lo dedicaremos a la tarea de regresión y cómo construir modelos de predicción numérica con algoritmos lineales. A continuación, en el tercer módulo, estudiaremos algunos conceptos importantes en el aprendizaje supervisado, como la complejidad de modelos y la capacidad de generalización. Veremos entonces algunas técnicas que te permitirán mejorar el rendimiento de tus modelos. Por último, en el cuarto módulo, estudiaremos la tarea de clasificación y cómo construir modelos predictivos con algoritmos basados en árboles de decisión. Este curso está pensado para personas de diferentes disciplinas que quieran adentrarse en el mundo del aprendizaje automático y sus aplicaciones en el análisis de información, que estén iniciando estudios universitarios o con un título profesional. El aspirante a tomar este curso puede provenir de cualquier campo del conocimiento y estar incorporado en cualquier ámbito industrial, empresarial o académico. Este curso requiere la instalación de un programa especial (Anaconda/Jupyter Notebook). Es recomendable que el equipo cuente con más de 4GB de RAM y espacio en disco duro superior a 1GB.
-
El manejo de datos que permita generar conocimiento útil para una organización es cada vez más importante en los trabajos de alta demanda al día de hoy. Es así como este curso presenta al estudiante una metodología para el desarrollo de proyectos basados en datos, en especial de ciencia de datos. Hace énfasis en los procesos de exploración, transformación, integración de fuentes de datos estructuradas y no estructuradas con el fin de mejorar la eficiencia y calidad en los resultados de análisis posteriores como los basados en modelos analíticos. El estudiante tendrá a su disposición diferentes tutoriales con ejemplos en contextos cercanos a la realidad para comprender mejor los conceptos desarrollados en el curso y practicar su aprendizaje con el punto de extensión propuesto en cada tutorial. De igual manera, contará con videos, lecturas ilustradas y sugerencias de lecturas para profundizar en los temas de interés. Consideramos que esto le permitirá al estudiante afianzar sus conocimientos llevando a la práctica lo aprendido.
-
Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante comprenderá los fundamentos de la ciencia de datos, las características de un científico de datos, las herramientas que utiliza, la metodología que se debe seguir para este estilo de proyectos, y estará en capacidad de aplicar técnicas estadísticas para la construcción e interpretación de modelos analíticos descriptivos. El curso consta de 4 módulos, cada uno de una semana, en los cuales al final del mismo, se tiene una lección dedicada al desarrollo del proyecto del curso. Los módulos son: Módulo 1. La ciencia de datos y los científicos de datos: En este módulo, se presenta los aspectos fundamentales de la ciencia de datos, la metodología ASUM-DM para la implementación de estos proyectos y la metodología design thinking para identificar problemas y oportunidades de negocio. Módulo 2. Análisis exploratorio de datos: En este módulo, se presenta los conceptos asociados a estadística descriptiva y exploratoria univariada, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio. Módulo 3. Modelos analíticos basados en estadística bivariada: En este módulo, se presenta los conceptos asociados a pruebas de correlación y análisis de tablas de contingencia, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio. Módulo 4. Comparaciones entre grupos y validación de modelos estadísticos: En este módulo, se presenta los conceptos asociados a ANOVAS a una y dos vías, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio. Este curso está pensado para personas de diferentes disciplinas que quieran adentrarse en el mundo de la ciencia de datos, que estén iniciando estudios universitarios o con títulos de técnicos o tecnológicos, así mismo, se recomienda tener un background de conocimientos básicos en probabilidad y estadística. El aspirante a tomar este curso puede provenir de cualquier campo del conocimiento ya sea de gobierno, la industria, la consultoría, la academia, etc. Para el desarrollo de este curso, es necesario la instalación de un programa especial (Anaconda – Jupyter Notebook) con el fin de poder realizar los análisis de los datos a través del lenguaje de programación Python, es recomendable que el equipo cuente con más de 4GB de RAM y espacio en disco duro superior a 1GB.
Taught by
Harry Cristhian Torres Moreno , Haydemar Nuñez Castro , John Calvo Martínez and Maria Del Pilar Villamil Giraldo