このコースでは、機械学習 (ML) ライフサイクルのデータ準備フェーズの一部について説明します。このコースの中でバイアス軽減やデータセキュリティの戦略など、データ検証の戦略について学習します。また、AWS Glue DataBrew や AWS Glue Data Quality など、データ検証に役立つ Amazon Web Services (AWS) のいくつかのサービスについて確認します。さらに、データセットの分割、シャッフル、拡張、モデルトレーニングリソースへのロード設定など、データ準備および設定の最終ステップについても学習します。
- コースレベル: 300
- 所要時間: 45 分
アクティビティ
- オンライン資料
- デモンストレーション
- ナレッジチェックの問題
- コースの評価テスト
コースの目標
- データの整合性を保つ重要性を説明する。
- トレーニング前の基本的なバイアスメトリクスを特定する。
- データセットのクラスの不均衡に対処するための戦略について説明する。
- データ品質を検証するための AWS の主要なサービスについて説明する。
- AWS ツールを使用して、データのバイアスの原因を特定して軽減する。
- AWS のサービスを使用してデータを暗号化する手法について説明する。
- コンプライアンス要件の影響を特定する。
- データセットの分割、シャッフル、拡張の価値と手法について説明する。
- モデルトレーニングで使用するデータ形式を特定する。
- モデルトレーニングデータの設定に使用する AWS のツールとサービスを特定する。
- データを設定してモデルトレーニングリソースに読み込む方法について説明する。
対象者
- クラウドアーキテクト
- 機械学習エンジニア
推奨スキル
- Amazon SageMaker および AWS の他のサービスを機械学習エンジニアリングに使用した経験が 1 年以上あること
- バックエンドソフトウェアデベロッパー、DevOps デベロッパー、データエンジニア、データサイエンティストなどの関連職種での経験が 1 年以上あること
- Python などのプログラミング言語に関する基本的な理解
- AWS 機械学習エンジニアアソシエイトの学習プランの先行コース
コースの概要
- セクション 1: はじめに
o レッスン 1: このコースの使用方法
o レッスン 2: コースの概要
o レッスン 3: データ検証の基本
- セクション 2: データの検証
o レッスン 4: クラスの不均衡への対処
o レッスン 5: データ検証とバイアス軽減用の AWS のツールとサービス
o レッスン 6: Amazon SageMaker Clarify によるバイアスの特定と軽減
o レッスン 7: データセキュリティとコンプライアンス
- セクション 3: データ準備の最終ステップ
o レッスン 8: データセットの分割、シャッフル、拡張
o レッスン 9: モデリングトレーニング用のデータ設定
- セクション 4: まとめ
o レッスン 10: コースのまとめ
o レッスン 11: 評価テスト
o レッスン 12: お問い合わせ
- 終了