What you'll learn:
- Nueva edición en: EscuelaDeDatosVivos. AI !
- Uso de Rstudio (entorno de desarrollo)
- Introducción al universo tidyverse y dplyr para análisis y preparación de datos
- Introducción a crear un modelo machine learning (random forest)
- Como cargar archivos txt/csv
- Manejo de datos, filtrar y reemplazar valores (R base, filter y mutate)
- Introducción al análisis exploratorio de datos (visual y numérico)
- Introducción a gráficos con ggplot2
- Ordenar y seleccionar columnas (arrange y select)
- Identificar reemplazar valores nulos (NA)
- Operadores aritméticos y lógicos
- Agrupar y sumarizar datos (group_by y summarise)
- Validar resultados del modelo con datos nuevos (curva gain)
- Bonus track! (R Markdown)
Actualización!Este curso migra con una 2da edición con más material a: EscuelaDeDatosVivos.AI :D
Bienvenid@s!
Este curso busca hacer una breve introducción, a los temas centrales de Ciencia de Datos, orientado a personas que nunca vieron nada de R.
A lo largo de 11 laboratorios, y 17 videos (más un bonus track), se le plantea al estudiante distintos métodos y funciones, para poder abordar eficientemente los temas comunes como son:
Carga de datos
Análisis exploratorio de datos
Preparación de datos
Creación y validación de un modelo predictivo
Los paquetes que usaremos serán:tidyverse (con dplyr y ggplot2), funModeling, corrr, Hmisc y randomForest.
Todos los laboratorios cuentan con su sección de ejercicios (y su correspondiente resolución), punto clave para poder fijar los conocimientos vistos.
Es un curso pensado para terminar en 5-días, incluyendo la parte de ejercicios. No es indispensable terminarlos todos, pero si intentarlo. La práctica y el error es la mejor manera de aprender.
>Si hay algo que no se entiende, o pensás que se puede mejorar, mandame un mensaje y lo tendré en cuenta para agregar como anexo. Es el primer curso online que hago, y estoy aprendiendo a mejorar :)
Este curso es solo el primer paso en su formación como Cientific@s de Datos.