En los labs prácticos, creará y administrará clústeres de Dataproc con la consola web y la CLI. Luego, usará los clústeres para ejecutar trabajos de Spark y Pig. A continuación, creará notebooks de IPython que se integran con BigQuery y el almacenamiento, y utilizará Spark. Por último, integrará las API de aprendizaje automático en el análisis de sus datos.
Requisitos previos
• Google Cloud Platform Big Data & Machine Learning Fundamentals (o contar con experiencia equivalente)
• Conocimientos de Python