I due componenti chiave di qualsiasi pipeline di dati sono costituiti dai data lake e dai data warehouse. In questo corso evidenzieremo i casi d'uso per ogni tipo di spazio di archiviazione e approfondiremo i dettagli tecnici delle soluzioni di data lake e data warehouse disponibili su Google Cloud. Inoltre, descriveremo il ruolo di un data engineer, illustreremo i vantaggi di una pipeline di dati di successo per le operazioni aziendali ed esamineremo i motivi per cui il data engineering dovrebbe essere eseguito in un ambiente cloud.
Questo è il primo corso della serie Data Engineering on Google Cloud. Dopo il completamento di questo corso, iscriviti al corso Building Batch Data Pipelines on Google Cloud.
Overview
Syllabus
- Introduzione
- Questo modulo fornisce un'introduzione ai corsi della serie Data Engineering on Google Cloud e a questo corso specifico, dal titolo Modernizing Data Lakes and Data Warehouses with Google Cloud.
- Introduzione al data engineering
- In questo modulo viene illustrato il ruolo del data engineer, spiegando perché le attività di data engineering dovrebbero essere eseguite nel cloud
- Creazione di un data lake
- In questo modulo viene spiegato che cos'è un data lake e come utilizzare Cloud Storage come data lake su Google Cloud.
- Creazione di un data warehouse
- In questo modulo parleremo di BigQuery come opzione di data warehouse su Google Cloud
- Riepilogo
- Riepilogo dei punti chiave per l'apprendimento
- Risorse del corso
- Link alle versioni PDF dei singoli moduli
Taught by
Google Cloud Training