實驗室概觀
貴公司 AnyCompany Consulting 想整合自然語言處理 (NLP),以從文件中擷取關鍵詞組、實體和情感。貴公司選擇了 Amazon Comprehend 做為 NLP 服務,以便將 NLP 整合到現有應用程式中。為了開始為其文件建立模型和端點的程序,他們希望您建立自訂實體辨識器模型,以辨識一組文件中的特定術語。
在本實驗室中,您將使用 Amazon Comprehend 建立並測試自訂實體辨識模型。
目標
本實驗室結束後,您將能夠:
- 使用 Amazon Comprehend 建立並測試自訂實體辨識模型。
- 使用自訂實體辨識端點進行即時分析。
技術知識先決條件
若要成功完成此實驗室,您應熟悉 AWS 管理主控台的基本瀏覽操作,並具備 Amazon S3 的知識。
授課時長
本實驗室練習需要大約 60 分鐘的時間來完成。
圖示圖例
此實驗室使用各種圖示提醒您注意不同類型的指示和注意事項。下列清單說明各圖示的用途:
- 注意:提示、秘訣或重要指引。
- 了解詳情:具體指明可取得更多資訊的位置。
- 提醒:有特殊影響或重要性的資訊(如果您錯過此資訊,不會對設備或資料造成太大的問題,但可能會導致需要重複特定步驟)。
- 考慮:暫停一下,思考如何將某概念應用在自有環境,或與他人討論目前這個主題。
- 檔案內容:顯示您需要執行的指令碼或檔案內容的程式碼區塊,這是為您預先建立的內容。
環境概觀
下圖顯示實驗室環境的基本架構:
在上圖中,訓練資料已上傳至 Amazon S3 儲存貯體。Amazon Comprehend 使用儲存貯體中的訓練資料來訓練自訂實體辨識模型。使用端點即時分析文件時,經過訓練的模型會找到文件中的任何實體。