实验概览
您的公司,AnyCompany Consulting,希望集成自然语言处理 (NLP) 技术从文档中提取关键短语、实体和情绪。你们选择了 Amazon Comprehend 作为他们的 NLP 服务,这样你们就可以将 NLP 集成到现有的应用程序中。为了能够为文档创建模型和终端节点,公司需要您创建一个自定义分类模型来通过类别和标签标识文档。
在本实验中,您将使用 Amazon Comprehend 创建并测试自定义分类模型。
目标
在本实验结束时,您将能够:
- 使用 Amazon Comprehend 创建自定义分类模型。
- 使用自定义分类终端节点进行实时分析。
技术性知识先决条件
为成功完成本实验,您应该熟悉 AWS 管理控制台的基本导航操作,并且具备 Amazon S3 的相关知识。
时长
完成本实验大约需要 75 分钟。
图标键
本实验中使用了不同图标,以提醒大家注意各种类型的说明和备注。下面的列表解释了每个图标的用途:
- 注意:一项提示、技巧或重要指导。
- 提醒:提示特别相关或重要的信息(重要程度还不至于不查看会引起设备或数据问题,但可能导致需要重复某些步骤)。
- 思考:暂停一下,思考如何在自己的环境中应用某个概念,或者就当前的主题展开讨论。
- 文件内容:一种代码块,显示了已为您预先创建的脚本或文件的内容,您需要运行该脚本或文件。
- 提示:针对某个问题或难点的提示。
- 答案:针对某个问题或难点的解答。
环境概览
下图显示了实验环境的基本架构:
在上图中,训练数据被上传到了 AmazonS3 存储桶。Amazon Comprehend 使用存储桶中的训练数据来训练自定义分类模型。使用终端节点实时分析文档时,经过训练的模型会对文档进行分类。