Overview
Las canalizaciones de datos suelen realizarse según uno de los paradigmas extracción y carga (EL); extracción, carga y transformación (ELT), o extracción, transformación y carga (ETL). En este curso, abordaremos qué paradigma se debe utilizar para los datos por lotes y cuándo corresponde usarlo. Además, veremos varias tecnologías de Google Cloud para la transformación de datos, incluidos BigQuery, la ejecución de Spark en Dataproc, grafos de canalización en Cloud Data Fusion y procesamiento de datos sin servidores en Dataflow. Los estudiantes obtienen experiencia práctica en la compilación de componentes de canalizaciones de datos en Google Cloud con Qwiklabs.
Syllabus
- Introducción
- En este módulo, presentamos el curso y el temario
- Module 1: Introducción a la compilación de canalizaciones de datos por lotes
- En este módulo, se revisan los diferentes métodos de carga de datos: EL, ELT y ETL, y cuándo corresponde usarlos
- Module 2: Ejecución de Spark en Dataproc
- En este módulo, se muestra cómo ejecutar Hadoop en Dataproc, usar Cloud Storage y optimizar tus trabajos de Dataproc.
- Module 3: Procesamiento de datos sin servidores con Dataflow
- En este módulo, se aborda el uso de Dataflow para compilar tus canalizaciones de procesamiento de datos
- Module 4: Administra canalizaciones de datos con Cloud Data Fusion y Cloud Composer
- En este módulo, se muestra como administrar canalizaciones de datos con Cloud Data Fusion y Cloud Composer
- Module 5: Resumen del curso
- Resumen del curso
Taught by
Google Cloud Training