ラボの概要
現在、勤めている AnyCompany Consulting では、ドキュメントから重要な語句、表現、感情を抽出するために自然言語処理 (NLP) を取り入れたいと考えています。会社は NLP サービスとして Amazon Comprehend を採用し、既存のアプリケーションに NLP を統合できるようになりました。会社のドキュメントに使用するモデルとエンドポイントの作成プロセスを開始するにあたって、収集したドキュメントから特定の表現を識別するカスタムの表現抽出器モデルを作成するように会社から依頼されました。
このラボでは、Amazon Comprehend を使用してカスタムの表現抽出モデルを作成してテストします。
目標
このラボを修了すると、次のことができるようになります。
- Amazon Comprehend を使用してカスタムの表現抽出モデルを作成する。
- カスタムの表現抽出エンドポイントを使ってリアルタイム分析を実行する。
技術知識の前提条件
このラボを完了するには、AWS マネジメントコンソールの基本操作を理解していることと Amazon S3 に関する知識を持っていることが必要です。
所要時間
このラボの所要時間は約 60 分です。
アイコンキー
このラボでは、さまざまな種類の手順と注記への注意を促すため、各種アイコンが使用されています。以下のリストは、各アイコンの目的を説明したものです。
- 注意: ヒントや重要なガイダンスです。
- 警告: 特記事項または重要な情報です (この情報を読み忘れても、機器やデータに問題が発生するというわけではありませんが、特定のステップを繰り返す必要が生じる可能性があります)。
- 検討: ここでは、少し時間を取ってそのコンセプトをどうすれば自分の環境に応用できるか考えたり、学習中のトピックについて議論したりします。
- ファイルの内容: 実行する必要のあるスクリプトまたはファイルの内容を示す、事前に作成されたコードブロックです。
環境の概要
以下の図は、ラボ環境の基本的なアーキテクチャを表しています。
上記の図では、トレーニングデータが Amazon S3 バケットにアップロードされています。Amazon Comprehend でバケットのトレーニングデータを使用して、カスタムの表現抽出モデルをトレーニングします。エンドポイントを使用してドキュメントをリアルタイムで分析し、トレーニング済みモデルによってドキュメント内の特定の表現を検出します。