实验概览
本实验演示了如何使用 Amazon SageMaker Canvas 创建机器学习 (ML) 模型,以根据新产品和服务的电子邮件活动来确定是否能保留住客户。
您是一家连锁零售店营销团队的业务分析师。该团队根据新的和现有产品和服务的各种电子邮件营销活动,掌握了大量关于首次购买后客户是否已保留住的数据。该团队正在尝试预测这些营销活动能否保留客户对公司提供的产品和服务的兴趣。
您的首席营销官希望您利用这些数据进行概念验证,以预测这些活动的有效性。您联系了公司的 IT 团队,他们建议您使用 SageMaker Canvas 来探索数据并进行预测,因为它不需要数据科学家具有深厚的 ML 专业知识即可进行预测。
涵盖的主题
完成本实验后,您将能够:
- 将数据从 Amazon Simple Storage Service (Amazon S3) 导入 SageMaker Canvas。
- 使用 SageMaker Canvas 管理数据,完成特征工程任务,并选择要预测的特征。
- 使用 SageMaker Canvas 构建和训练模型,以预测是否能保留住客户。
- 查看实验架构和安全实现。
- 使用 SageMaker Canvas 评估模型。
- 使用示例数据进行预测。
此图显示了您将在本演示中完成的任务。此图后面的表格详细解释了架构,以及它与您将在本实验中完成的任务之间的关系。
带编号的任务 详细信息 1 以没有管理员角色的用户身份登录到 SageMaker 控制台。请注意,我们已经使用管理员用户创建了一个 SageMaker 域,并授予您使用 SageMaker Canvas 所需的 AWS Identity and Access Management (IAM) 权限。 2 访问 AWS Cloud9 并使用 Python 转换数据集文件 storedata_total.csv。 3 将数据集从 Amazon S3 导入 Canvas。然后,在 Canvas 中预览数据。 4 在数据集中为预测选择目标列。然后,SageMaker Canvas 将根据数据集来推荐您可以使用的模型类型。 5 准备并分析数据。此阶段的步骤包括查看模型配方和特征工程,此时您要对数据集进行更改,以确定如何训练模型。 6 快速构建模型。快速构建比标准构建用时更短,但可能不太准确。 7 使用 Canvas 中的 Analyze(分析)选项卡评估模型。使用批量预测选项测试模型对新数据进行预测并审查结果的能力。 8 检索模型构件并移除 SageMaker Canvas 资源。 9 清理与数据和模型相关的 AWS 资源。前提条件
本实验需要以下配置:
- 拥有运行 Microsoft Windows、macOS 或 Linux(Ubuntu、SuSE 或 Red Hat)的电脑
- 电脑上安装了现代化互联网浏览器,例如 Chrome 或 Firefox
图标键
本实验中使用了各种图标,以提醒注意指南的某些方面。下面的列表解释了每个图标的用途:
- 键盘图标表示您必须运行一个命令。
- 剪贴板图标表示您可以将命令或编辑过的文件与提供的示例进行比较,以此验证其输出。
- 注意图标表示重要的提示、技巧、指导或建议。
- “i” 圆圈图标说明了在哪里可以找到更多信息。
- 带复选标记的人形图标表示有机会检查您的知识掌握程度并测试您学到的知识。