Data Engineer, Big Data and ML on Google Cloud em Português
Google Cloud via Coursera Specialization
Overview
Nesta especialização on-line intensiva de cinco semanas, os participantes terão uma introdução prática sobre como projetar e criar sistemas de processamento de dados no Google Cloud Platform. Por meio de uma combinação de apresentações, demonstrações e laboratórios práticos, os participantes aprenderão a projetar sistemas de processamento de dados, criar canais completos e análises de dados e desenvolver soluções de aprendizado de máquina. Neste curso, abordamos dados estruturados, não estruturados e de streaming. Neste curso, os participantes irão adquirir as seguintes habilidades: • projetar e criar sistemas de processamento de dados no Google Cloud Platform • usar dados não estruturados com as APIs do Spark e de aprendizado de máquina no Cloud Dataproc • processar dados em lote e streaming com a implementação de canais de dados de escalonamento automático no Cloud Dataflow • derivar insights de negócios a partir de conjuntos de dados extremamente grandes usando o Google BigQuery • treinar, avaliar e prever com modelos de aprendizado de máquina usando o TensorFlow e o Cloud ML • ativar insights instantâneos dos dados de streaming Esta aula destina-se a desenvolvedores experientes responsáveis pelo gerenciamento de transformações de Big Data. >>> Ao se inscrever nesta especialização, você concorda com os Termos de Serviço do Qwiklabs conforme estabelecido na seção de perguntas frequentes. Veja os Termos de Serviço aqui: https://qwiklabs.com/terms_of_service <<<
Syllabus
Course 1: Google Cloud Platform Big Data and Machine Learning Fundamentals em Português Brasileiro
- Offered by Google Cloud. Neste curso, apresentamos os produtos e serviços de Big Data e machine learning do Google Cloud que dão suporte ao ... Enroll for free.
Course 2: Modernizing Data Lakes and Data Warehouses with GCP em Português Brasileiro
- Offered by Google Cloud. Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os ... Enroll for free.
Course 3: Building Batch Data Pipelines on GCP em Português Brasileiro
- Offered by Google Cloud. Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, ... Enroll for free.
Course 4: Building Resilient Streaming Analytics Systems on GCP em Português Brasileiro
- Offered by Google Cloud. O processamento de dados de streaming é cada vez mais usado pelas empresas para gerar métricas sobre as operações ... Enroll for free.
Course 5: Smart Analytics, Machine Learning, and AI on GCP em Português Brasileiro
- Offered by Google Cloud. A incorporação de machine learning em pipelines de dados aumenta a capacidade de extrair insights dessas ... Enroll for free.
- Offered by Google Cloud. Neste curso, apresentamos os produtos e serviços de Big Data e machine learning do Google Cloud que dão suporte ao ... Enroll for free.
Course 2: Modernizing Data Lakes and Data Warehouses with GCP em Português Brasileiro
- Offered by Google Cloud. Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os ... Enroll for free.
Course 3: Building Batch Data Pipelines on GCP em Português Brasileiro
- Offered by Google Cloud. Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, ... Enroll for free.
Course 4: Building Resilient Streaming Analytics Systems on GCP em Português Brasileiro
- Offered by Google Cloud. O processamento de dados de streaming é cada vez mais usado pelas empresas para gerar métricas sobre as operações ... Enroll for free.
Course 5: Smart Analytics, Machine Learning, and AI on GCP em Português Brasileiro
- Offered by Google Cloud. A incorporação de machine learning em pipelines de dados aumenta a capacidade de extrair insights dessas ... Enroll for free.
Courses
-
Neste curso, apresentamos os produtos e serviços de Big Data e machine learning do Google Cloud que dão suporte ao ciclo de vida de dados para IA. Nele, você verá os processos, desafios e benefícios de criar um pipeline de Big Data e modelos de machine learning com a Vertex AI no Google Cloud.
-
A incorporação de machine learning em pipelines de dados aumenta a capacidade de extrair insights dessas informações. Neste curso, mostramos as várias formas de incluir essa tecnologia em pipelines de dados do Google Cloud. Para casos de pouca ou nenhuma personalização, vamos falar sobre o AutoML. Para usar recursos de machine learning mais personalizados, vamos apresentar os Notebooks e o machine learning do BigQuery (BigQuery ML). No curso, você também vai aprender sobre a produção de soluções de machine learning usando a Vertex AI.
-
Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud de forma detalhada e técnica. Além disso, também descrevemos o papel de um engenheiro de dados, os benefícios de um pipeline de dados funcional para operações comerciais e analisamos por que a engenharia de dados deve ser feita em um ambiente de nuvem. Este é o primeiro curso da série ""Data Engineering on Google Cloud"". Após a conclusão, recomendamos que você comece o curso ""Building Batch Data Pipelines on Google Cloud"".
-
Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
-
O processamento de dados de streaming é cada vez mais usado pelas empresas para gerar métricas sobre as operações comerciais em tempo real. Neste curso, você vai aprender a criar pipelines de dados de streaming no Google Cloud. O Pub/Sub é apresentado como a ferramenta para gerenciar dados de streaming de entrada. No curso, também abordamos a aplicação de agregações e transformações a dados de streaming usando o Dataflow, além de formas de armazenar registros processados no BigQuery ou no Cloud Bigtable para análise. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados de streaming no Google Cloud usando o Qwiklabs.
Taught by
Google Cloud Training