实验概览
贵公司 AnyCompany Consulting 希望集成自然语言处理 (NLP) 以从文档中提取关键短语、实体和情绪。他们选择了 Amazon Comprehend 作为他们的 NLP 服务,这样他们就可以将 NLP 集成到现有的应用程序中。为了开始为文档创建模型和终端节点的过程,他们希望您创建一个自定义实体识别模型来标识多个文档中的具体词语。
在本实验中,您将使用 Amazon Comprehend 创建并测试自定义识别模型。
目标
在本实验结束时,您将能够:
- 使用 Amazon Comprehend 创建自定义实体识别模型。
- 使用自定义实体识别终端节点进行实时分析。
技术性知识先决条件
要成功完成本实验,您应该熟悉 AWS 管理控制台的基本导航操作,并且具备 Amazon S3 的相关知识。
时长
完成本实验大约需要 60 分钟。
图标键
本实验中使用了不同图标,以提醒大家注意各种类型的说明和备注。下面的列表解释了每个图标的用途:
- 注意:一项提示、技巧或重要指导。
- 提醒:提示特别相关或重要的信息(不查看该信息并不会损坏设备或数据,但可能导致需要重复某些步骤)。
- 思考:暂停一下,思考如何在自己的环境中应用某个概念,或者就当前的主题展开讨论。
- 文件内容:一种代码块,显示了已为您预先创建的脚本或文件的内容,您需要运行该脚本或文件。
环境概览
下图显示了实验环境的基本架构:
在上图中,训练数据上传到了 Amazon S3 存储桶。Amazon Comprehend 使用存储桶中的训练数据来训练自定义实体识别模型。当使用终端节点实时分析文档时,经过训练的模型会找到文档中的任何实体。