このコースでは、まず、データ品質を向上させる方法や探索的データ分析を行う方法など、データについての議論から始めます。Vertex AI AutoML について確認し、コードを一切記述せずに ML モデルを構築、トレーニング、デプロイする方法を説明します。また、BigQuery ML のメリットを確認します。その後、ML モデルを最適化する方法、一般化とサンプリングを活用してカスタム トレーニング向けに ML モデルの品質を評価する方法を説明します。
Overview
Syllabus
- はじめに
- このモジュールでは、コースの概要とその目標を説明します。
- データについて知る: 探索的データ分析によるデータ品質の改善
- このモジュールでは、探索的データ分析を行うことで、データの品質を向上させる方法と、データを探索する方法について紹介します。ML におけるデータ整理の重要性について説明し、これがデータ品質にどのように影響するかを示します。例えば欠損値があると結果に歪みが生じる可能性があります。また、データ探索の重要性についても学びます。データを整理したら、データセットに対して探索的データ分析を行います。
- ML の実践
- このモジュールでは、ML の実務担当者としての成長を加速できるように、ML の主要なタイプを紹介します。
- Vertex AI を使用した AutoML モデルのトレーニング
- このモジュールでは、Vertex AI を使用した AutoML モデルのトレーニングについて紹介します。
- BigQuery の ML: データのある場所で ML モデルを開発する
- このモジュールでは、BigQuery ML とその機能を紹介します。
- 最適化
- このモジュールでは、ML モデルを最適化する方法を説明します。
- 一般化とサンプリング
- 次に、かなり変わった質問にお答えいただきます。最も正確な ML モデルを最も適切なモデルとして選ぶべきでないのは、どのような場合ですか? 最適化に関する最後のモジュールで示唆したとおり、モデルのトレーニング データセットの損失指標が 0 だからといって、実際の環境の新しいデータでうまく機能するわけではありません。再現可能なトレーニング用、評価用、テスト用データセットを作成し、パフォーマンス ベンチマークを確立する方法を説明します。
- まとめ
- このモジュールは、「Launching into Machine Learning」(ML の解説)コースのまとめです。
Taught by
Google Cloud Training