ラボの概要
AnyCompany Consulting では、ドキュメントから重要な語句、表現、感情を抽出するために自然言語処理 (NLP) を取り入れたいと考えています。NLP サービスの Amazon Comprehend を採用したので、既存のアプリケーションに NLP を統合できるようになりました。AnyCompany Consulting はドキュメントのモデルとエンドポイントの作成をスタートするにあたり、カスタム分類モデルを作成してドキュメントをカテゴリとラベルで特定できるようにしてほしいと考えています。
このラボでは、Amazon Comprehend を使用してカスタム分類モデルの作成とテストを行います。
目標
このラボを修了すると、次のことができるようになります。
- Amazon Comprehend を使用してカスタム分類モデルを作成する。
- カスタム分類エンドポイントを使用してリアルタイム分析を実施する。
技術知識の前提条件
このラボを完了するには、AWS マネジメントコンソールの基本操作を熟知していることと Amazon S3 に関する知識を持っていることが必要です。
所要時間
このラボの所要時間は約 75 分です。
アイコンキー
このラボでは、さまざまな種類の手順と注記への注意を促すため、各種アイコンが使用されています。以下のリストは、各アイコンの目的を説明したものです。
- 注意: ヒントや重要なガイダンスです。
- 警告: 特記事項または重要な情報です (この情報を読み忘れても、機器やデータに問題が発生するというわけではありませんが、特定のステップを繰り返す必要が生じる可能性があります)。
- 検討: ここでは、少し時間を取ってそのコンセプトをどうすれば自分の環境に応用できるか考えたり、学習中のトピックについて議論したりします。
- ファイルの内容: 実行する必要のあるスクリプトまたはファイルの内容を示す、事前に作成されたコードブロックです。
- ヒント: 質問や課題のヒント
- 解答: 質問や課題の解答
環境の概要
以下の図は、ラボ環境の基本的なアーキテクチャを表しています。
上記の図では、トレーニングデータが Amazon S3 バケットにアップロードされています。Amazon Comprehend では、バケット内のトレーニングデータを使用してカスタム分類モデルをトレーニングします。エンドポイントを使用してドキュメントがリアルタイムで分析されると、トレーニング済みモデルがドキュメントを分類します。