Data Engineer, Big Data and ML on Google Cloud auf Deutsch
Google Cloud and Google via Coursera Specialization
Overview
Class Central Tips
Dieser fünfwöchige Onlinevertiefungskurs bietet eine praktische Einführung zum Entwerfen und Erstellen von Datenverarbeitungssystemen auf der Google Cloud. In Präsentationen, Demos und praxisorientierten Labs entwickeln die Teilnehmer Datenverarbeitungssysteme, erstellen End-to-End-Datenpipelines, analysieren Daten und üben maschinelles Lernen. Dieser Kurs vermittelt den Teilnehmern die folgenden Kompetenzen:
• Datenverarbeitungssysteme auf der Google Cloud entwickeln
• Unstrukturierte Daten mit Spark und ML-APIs auf Cloud Dataproc verwenden
• Batch- und Streaming-Daten durch die Implementierung von Autoscaling-Datenpipelines auf Cloud Dataflow verarbeiten
• Mit Google BigQuery Geschäftsinformationen aus extrem großen Datasets ableiten
• Modelle des maschinellen Lernens mit TensorFlow und Cloud ML trainieren, auswerten und damit Vorhersagen treffen
• Sofortige Statistiken aus Streaming-Daten ermöglichen
• Dieser Kurs richtet sich an erfahrene Entwickler, die für die Verwaltung von Big Data-Transformationen verantwortlich sind, zum Beispiel:
• Daten extrahieren, laden, transformieren, bereinigen und validieren
• Pipelines und Architekturen für die Datenverarbeitung entwerfen
• Modelle des maschinellen Lernens und der Statistik erstellen und warten
• Datasets abfragen, Abfrageergebnisse visualisieren und Berichte erstellen
> Mit Ihrer Teilnahme an dieser Spezialisierung stimmen Sie den Nutzungsbedingungen von Qwiklabs zu: https://qwiklabs.com/terms_of_service
Syllabus
Course 1: Google Cloud Platform Big Data and Machine Learning Fundamentals auf Deutsch
- In diesem einwöchigen On-Demand-Intensivkurs erhalten die Teilnehmer eine Einführung in die Funktionen der Google Cloud Platform (GCP) für Big Data und maschinelles Lernen. Dabei wird ein kurzer Überblick über die Google Cloud Platform geboten, während die Funktionen für die Datenverarbeitung eingehender behandelt werden. Nach Abschluss dieses Kurses sind die Teilnehmer in der Lage: • den Zweck und den Nutzen der wichtigsten Produkte für Big Data und maschinelles Lernen in der Google Cloud Platform zu beschreiben • vorhandene MySQL- und Hadoop-/Pig-/Spark-/Hive-Arbeitslasten mit Cloud SQL und Cloud Dataproc zur Google Cloud Platform zu migrieren • mit BigQuery und Cloud Datalab interaktive Datenanalysen vorzunehmen • zwischen Cloud SQL, Bigtable und Datastore zu wählen • mit TensorFlow ein neuronales Netzwerk zu trainieren und zu verwenden • eine Auswahl zwischen verschiedenen Datenverarbeitungsprodukten in der Google Cloud Platform zu treffen Wenn Sie sich zu diesem Kurs anmelden möchten, sollten Sie ungefähr ein (1) Jahr Erfahrung in einem oder mehreren der folgenden Bereiche haben: • Gängige Abfragesprachen, z. B. SQL • Extraktions-, Transformations-, Ladeaktivitäten • Datenmodellierung • Maschinelles Lernen und/oder Statistik • Programmierung in Python Hinweise zum Google-Konto: • In China stehen die Dienste von Google derzeit nicht zur Verfügung
Course 2: Modernizing Data Lakes and Data Warehouses with GCP auf Deutsch
- Die zwei wichtigsten Komponenten jeder Datenpipeline sind Data Lakes und Data Warehouses. In diesem Kurs werden Anwendungsfälle für beide Speicherarten vorgestellt. Außerdem wird eine technisch detaillierte Einteilung der Data-Lake- und Data-Warehouse-Lösungen vorgenommen, die in der Google Cloud Platform verfügbar sind. Im Kurs wird auch erläutert, welche Aufgaben ein Data Engineer hat, wie eine erfolgreiche Datenpipeline Geschäftsvorgänge unterstützt und warum Data Engineering in einer Cloud-Umgebung stattfinden sollte. Mithilfe von Qwiklabs arbeiten die Kursteilnehmer dann selbst mit Data Lakes und Data Warehouses in der Google Cloud Platform.
Course 3: Building Batch Data Pipelines on GCP auf Deutsch
- Datenpipelines folgen in der Regel dem Muster Extrahieren und Laden (EL), Extrahieren, Laden und Transformieren (ELT) oder Extrahieren, Transformieren und Laden (ETL). Im Kurs wird beschrieben, welcher Ansatz in welcher Situation für Batchdaten geeignet ist. Außerdem werden verschiedene Technologien der Google Cloud Platform zur Datentransformation behandelt, wie BigQuery, das Ausführen von Spark in Cloud Dataproc, Pipelinediagramme in Cloud Data Fusion und die serverlose Datenverarbeitung mit Cloud Dataflow. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Datenpipeline in der Google Cloud Platform.
Course 4: Building Resilient Streaming Analytics Systems on GCP auf Deutsch
- *Hinweis: Dieser Kurs ist neu und enthält aktualisierte Inhalte, die sich möglicherweise von Inhalten in früheren Versionen der Spezialisierung unterscheiden. Die Verarbeitung von Streamingdaten gewinnt zunehmend an Bedeutung, weil sich mit Streaming Echtzeitmesswerte für Geschäftsvorgänge abrufen lassen. Im Kurs wird behandelt, wie Streamingdaten-Pipelines in der Google Cloud Platform erstellt werden. Zur Verarbeitung eingehender Streamingdaten wird Cloud Pub/Sub verwendet. Außerdem erklären wir, wie Aggregationen und Transformationen mit Cloud Dataflow auf Streamingdaten angewendet werden und wie verarbeitete Datensätze für Analysen in BigQuery oder Cloud Bigtable gespeichert werden. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Streamingdaten-Pipeline in der Google Cloud Platform.
Course 5: Smart Analytics, Machine Learning, and AI on GCP auf Deutsch
- Unternehmen, die maschinelles Lernen (ML) für Datenpipelines einsetzen, gewinnen leichter Informationen aus ihren Daten. Im Kurs lernen Sie, wie maschinelles Lernen mit verschiedenen Anpassungsstufen in Datenpipelines auf der Google Cloud Platform integriert werden kann. Für Lösungen mit wenig oder ohne Anpassung wird AutoML vorgestellt. Detailliertere ML-Funktionen lernen Sie in den Diensten AI Platform Notebooks und BigQuery ML kennen. Außerdem machen Sie sich mit der Anwendung von ML-Lösungen mit Kubeflow vertraut. Wie sich ML-Modelle in der Google Cloud Platform errichten lassen, üben Sie in den praxisorientierten Labs in Qwiklabs.
- In diesem einwöchigen On-Demand-Intensivkurs erhalten die Teilnehmer eine Einführung in die Funktionen der Google Cloud Platform (GCP) für Big Data und maschinelles Lernen. Dabei wird ein kurzer Überblick über die Google Cloud Platform geboten, während die Funktionen für die Datenverarbeitung eingehender behandelt werden. Nach Abschluss dieses Kurses sind die Teilnehmer in der Lage: • den Zweck und den Nutzen der wichtigsten Produkte für Big Data und maschinelles Lernen in der Google Cloud Platform zu beschreiben • vorhandene MySQL- und Hadoop-/Pig-/Spark-/Hive-Arbeitslasten mit Cloud SQL und Cloud Dataproc zur Google Cloud Platform zu migrieren • mit BigQuery und Cloud Datalab interaktive Datenanalysen vorzunehmen • zwischen Cloud SQL, Bigtable und Datastore zu wählen • mit TensorFlow ein neuronales Netzwerk zu trainieren und zu verwenden • eine Auswahl zwischen verschiedenen Datenverarbeitungsprodukten in der Google Cloud Platform zu treffen Wenn Sie sich zu diesem Kurs anmelden möchten, sollten Sie ungefähr ein (1) Jahr Erfahrung in einem oder mehreren der folgenden Bereiche haben: • Gängige Abfragesprachen, z. B. SQL • Extraktions-, Transformations-, Ladeaktivitäten • Datenmodellierung • Maschinelles Lernen und/oder Statistik • Programmierung in Python Hinweise zum Google-Konto: • In China stehen die Dienste von Google derzeit nicht zur Verfügung
Course 2: Modernizing Data Lakes and Data Warehouses with GCP auf Deutsch
- Die zwei wichtigsten Komponenten jeder Datenpipeline sind Data Lakes und Data Warehouses. In diesem Kurs werden Anwendungsfälle für beide Speicherarten vorgestellt. Außerdem wird eine technisch detaillierte Einteilung der Data-Lake- und Data-Warehouse-Lösungen vorgenommen, die in der Google Cloud Platform verfügbar sind. Im Kurs wird auch erläutert, welche Aufgaben ein Data Engineer hat, wie eine erfolgreiche Datenpipeline Geschäftsvorgänge unterstützt und warum Data Engineering in einer Cloud-Umgebung stattfinden sollte. Mithilfe von Qwiklabs arbeiten die Kursteilnehmer dann selbst mit Data Lakes und Data Warehouses in der Google Cloud Platform.
Course 3: Building Batch Data Pipelines on GCP auf Deutsch
- Datenpipelines folgen in der Regel dem Muster Extrahieren und Laden (EL), Extrahieren, Laden und Transformieren (ELT) oder Extrahieren, Transformieren und Laden (ETL). Im Kurs wird beschrieben, welcher Ansatz in welcher Situation für Batchdaten geeignet ist. Außerdem werden verschiedene Technologien der Google Cloud Platform zur Datentransformation behandelt, wie BigQuery, das Ausführen von Spark in Cloud Dataproc, Pipelinediagramme in Cloud Data Fusion und die serverlose Datenverarbeitung mit Cloud Dataflow. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Datenpipeline in der Google Cloud Platform.
Course 4: Building Resilient Streaming Analytics Systems on GCP auf Deutsch
- *Hinweis: Dieser Kurs ist neu und enthält aktualisierte Inhalte, die sich möglicherweise von Inhalten in früheren Versionen der Spezialisierung unterscheiden. Die Verarbeitung von Streamingdaten gewinnt zunehmend an Bedeutung, weil sich mit Streaming Echtzeitmesswerte für Geschäftsvorgänge abrufen lassen. Im Kurs wird behandelt, wie Streamingdaten-Pipelines in der Google Cloud Platform erstellt werden. Zur Verarbeitung eingehender Streamingdaten wird Cloud Pub/Sub verwendet. Außerdem erklären wir, wie Aggregationen und Transformationen mit Cloud Dataflow auf Streamingdaten angewendet werden und wie verarbeitete Datensätze für Analysen in BigQuery oder Cloud Bigtable gespeichert werden. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Streamingdaten-Pipeline in der Google Cloud Platform.
Course 5: Smart Analytics, Machine Learning, and AI on GCP auf Deutsch
- Unternehmen, die maschinelles Lernen (ML) für Datenpipelines einsetzen, gewinnen leichter Informationen aus ihren Daten. Im Kurs lernen Sie, wie maschinelles Lernen mit verschiedenen Anpassungsstufen in Datenpipelines auf der Google Cloud Platform integriert werden kann. Für Lösungen mit wenig oder ohne Anpassung wird AutoML vorgestellt. Detailliertere ML-Funktionen lernen Sie in den Diensten AI Platform Notebooks und BigQuery ML kennen. Außerdem machen Sie sich mit der Anwendung von ML-Lösungen mit Kubeflow vertraut. Wie sich ML-Modelle in der Google Cloud Platform errichten lassen, üben Sie in den praxisorientierten Labs in Qwiklabs.
Courses
-
In diesem einwöchigen On-Demand-Intensivkurs erhalten die Teilnehmer eine Einführung in die Funktionen der Google Cloud Platform (GCP) für Big Data und maschinelles Lernen. Dabei wird ein kurzer Überblick über die Google Cloud Platform geboten, während die Funktionen für die Datenverarbeitung eingehender behandelt werden.
Nach Abschluss dieses Kurses sind die Teilnehmer in der Lage:
• den Zweck und den Nutzen der wichtigsten Produkte für Big Data und maschinelles Lernen in der Google Cloud Platform zu beschreiben
• vorhandene MySQL- und Hadoop-/Pig-/Spark-/Hive-Arbeitslasten mit Cloud SQL und Cloud Dataproc zur Google Cloud Platform zu migrieren
• mit BigQuery und Cloud Datalab interaktive Datenanalysen vorzunehmen
• zwischen Cloud SQL, Bigtable und Datastore zu wählen
• mit TensorFlow ein neuronales Netzwerk zu trainieren und zu verwenden
• eine Auswahl zwischen verschiedenen Datenverarbeitungsprodukten in der Google Cloud Platform zu treffen
Wenn Sie sich zu diesem Kurs anmelden möchten, sollten Sie ungefähr ein (1) Jahr Erfahrung in einem oder mehreren der folgenden Bereiche haben:
• Gängige Abfragesprachen, z. B. SQL
• Extraktions-, Transformations-, Ladeaktivitäten
• Datenmodellierung
• Maschinelles Lernen und/oder Statistik
• Programmierung in Python
Hinweise zum Google-Konto:
• In China stehen die Dienste von Google derzeit nicht zur Verfügung -
Unternehmen, die maschinelles Lernen (ML) für Datenpipelines einsetzen, gewinnen leichter Informationen aus ihren Daten. Im Kurs lernen Sie, wie maschinelles Lernen mit verschiedenen Anpassungsstufen in Datenpipelines auf der Google Cloud Platform integriert werden kann. Für Lösungen mit wenig oder ohne Anpassung wird AutoML vorgestellt. Detailliertere ML-Funktionen lernen Sie in den Diensten AI Platform Notebooks und BigQuery ML kennen. Außerdem machen Sie sich mit der Anwendung von ML-Lösungen mit Kubeflow vertraut. Wie sich ML-Modelle in der Google Cloud Platform errichten lassen, üben Sie in den praxisorientierten Labs in Qwiklabs.
-
Datenpipelines folgen in der Regel dem Muster Extrahieren und Laden (EL), Extrahieren, Laden und Transformieren (ELT) oder Extrahieren, Transformieren und Laden (ETL). Im Kurs wird beschrieben, welcher Ansatz in welcher Situation für Batchdaten geeignet ist. Außerdem werden verschiedene Technologien der Google Cloud Platform zur Datentransformation behandelt, wie BigQuery, das Ausführen von Spark in Cloud Dataproc, Pipelinediagramme in Cloud Data Fusion und die serverlose Datenverarbeitung mit Cloud Dataflow. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Datenpipeline in der Google Cloud Platform.
-
Die zwei wichtigsten Komponenten jeder Datenpipeline sind Data Lakes und Data Warehouses. In diesem Kurs werden Anwendungsfälle für beide Speicherarten vorgestellt. Außerdem wird eine technisch detaillierte Einteilung der Data-Lake- und Data-Warehouse-Lösungen vorgenommen, die in der Google Cloud Platform verfügbar sind. Im Kurs wird auch erläutert, welche Aufgaben ein Data Engineer hat, wie eine erfolgreiche Datenpipeline Geschäftsvorgänge unterstützt und warum Data Engineering in einer Cloud-Umgebung stattfinden sollte. Mithilfe von Qwiklabs arbeiten die Kursteilnehmer dann selbst mit Data Lakes und Data Warehouses in der Google Cloud Platform.
-
*Hinweis: Dieser Kurs ist neu und enthält aktualisierte Inhalte, die sich möglicherweise von Inhalten in früheren Versionen der Spezialisierung unterscheiden.
Die Verarbeitung von Streamingdaten gewinnt zunehmend an Bedeutung, weil sich mit Streaming Echtzeitmesswerte für Geschäftsvorgänge abrufen lassen. Im Kurs wird behandelt, wie Streamingdaten-Pipelines in der Google Cloud Platform erstellt werden. Zur Verarbeitung eingehender Streamingdaten wird Cloud Pub/Sub verwendet. Außerdem erklären wir, wie Aggregationen und Transformationen mit Cloud Dataflow auf Streamingdaten angewendet werden und wie verarbeitete Datensätze für Analysen in BigQuery oder Cloud Bigtable gespeichert werden. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Streamingdaten-Pipeline in der Google Cloud Platform.
Taught by
Google Cloud Training