Building Batch Data Pipelines on GCP em Português Brasileiro

Overview

Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.

Syllabus

Introdução

Neste módulo, vamos apresentar o curso e a programação.

Introdução à criação de pipelines de dados em lote

Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.

Como executar o Spark no Dataproc

Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.

Processamento de dados sem servidor com o Dataflow

Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.

Gerenciamento de pipelines de dados com o Cloud Data Fusion e o Cloud Composer

Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.

Resumo do curso

Resumo do curso

Taught by

Google Cloud Training

Reviews

4.7 rating at Coursera based on 15 ratings

Start your review of Building Batch Data Pipelines on GCP em Português Brasileiro

Taught by

Building Resilient Streaming Analytics Systems on GCP em Português Brasileiro

Modernizing Data Lakes and Data Warehouses with GCP em Português Brasileiro

Serverless Data Processing with Dataflow: Foundations em Português Brasileiro

Data Engineering on Google Cloud Platform em Português Brasileiro

Serverless Data Analysis with Google BigQuery and Cloud Dataflow em Português Brasileiro

Serverless Data Processing with Dataflow: Operations em Português Brasileiro

100+ Google Cloud Certification Training Courses

1800+ Coursera Courses That Are Still Completely FREE

250 Top FREE Coursera Courses of All Time

Massive List of MOOC-based Microcredentials

Never Stop Learning.