このコースでは、Vertex AI Feature Store を使用するメリット、ML モデルの精度を向上させる方法、最も有効な特徴を抽出できるデータ列の見極め方について説明します。また、BigQuery ML、Keras、TensorFlow を使用した特徴量エンジニアリングに関するコンテンツとラボも用意されています。
Overview
Syllabus
- はじめに
- このモジュールでは、コースの概要とその目標を説明します。
- Vertex AI Feature Store の概要
- このモジュールでは、Vertex AI Feature Store を紹介します。
- 元データから特徴への変換
- 特徴量エンジニアリングは多くの場合、ML プロジェクトの構築において最も長く、困難なフェーズです。特徴量エンジニアリングのプロセスでは、元データから開始し、独自のドメイン知識を用いてML アルゴリズムを機能させるための特徴を作成します。このモジュールでは、どのような特徴が優れているのか、そして優れた特徴をどのように ML モデルで表現するのかについて確認します。
- 特徴量エンジニアリング
- このモジュールでは、ML と統計情報の違いを確認し、BigQuery ML と Keras の両方で特徴量エンジニアリングを実行する方法について説明します。また、高度な特徴量エンジニアリングの実践例も紹介します。
- 前処理と特徴の作成
- このモジュールでは、Apache Beam を補完する技術である Dataflow について詳しく説明します。Apache Beam と Dataflow は、どちらも前処理や特徴量エンジニアリングを構築して実行するのに役立ちます。
- 特徴クロス - TensorFlow Playground
- 従来の ML では、特徴クロスはあまり重要な役割を担っていませんでしたが、最新の ML メソッドでは、特徴クロスは非常に有効なツールキットの一部となっています。このモジュールでは、特徴クロスが機械の学習に非常に有益となる問題の種類を認識する方法を確認していきます。
- TensorFlow Transform の概要
- TensorFlow Transform(tf.Transform)は、TensorFlow でデータを前処理するためのライブラリです。tf.Transform は、次のような全走査データを必要とする前処理に便利です。平均値と標準偏差による入力値の正規化、値に対するすべての入力サンプルの確認による語彙の整数値化、観測されたデータの分布に基づく入力のバケット化などです。このモジュールでは、tf.Transform のユースケースを確認します。
- まとめ
- このモジュールは、「特徴量エンジニアリング」コースのまとめです。
Taught by
Google Cloud Training