Amazon EMR 是业界领先的云大数据解决方案,可使用 Apache Spark、Apache Hive 和 Presto 等开源框架进行 PB 级数据处理、交互式分析和机器学习。您可以使用 Amazon EMR 来设置、操作和扩展大数据环境,并自动执行耗时的任务(例如,预置容量)。
在本课程中,您将了解 Amazon EMR Serverless,它是 Amazon EMR 的一项新功能,可让数据工程师和分析师有效且经济高效地运行使用开源大数据框架构建的应用程序,而无需调整、操作、优化、保护或管理集群。此外,您还将了解 Amazon EMR 的优势、典型使用案例和技术概念。您将有机会通过 AWS 管理控制台在教程中试用 Amazon EMR Serverless 和 Amazon EMR 集群。
- 课程级别:基础级
- 时长:1 小时
注意:本课程具有本地化的注释/字幕。 旁白保留英语。要显示字幕,请单击播放器右下角的 CC 按钮。
课程目标
本课程包括演示文稿、图形和教程,并配有演示(可选)。
课程目标
在本课程中,您将:
- 了解 Amazon EMR 提供的不同部署选项。
- 了解 Amazon EMR 的工作原理。
- 了解 Amazon EMR Serverless 的技术概念。
- 列出 Amazon EMR Serverless 的典型使用案例。
- 了解 Amazon EMR 集群的技术概念。
- 列出 Amazon EMR 集群的典型使用案例。
- 具体说明在现实场景中使用 Amazon EMR 的要求。
- 了解 Amazon EMR 的优势。
- 说明 Amazon EMR 的成本结构。
- 使用 Amazon EMR Serverless 和 Amazon EMR 集群。
培训对象
本课程面向:
- 开发人员
- 解决方案架构师
- 数据工程师
- 数据架构师
先决条件
AWS Technical Essentials
Fundamentals of Analytics on AWS – Part 1
Fundamentals of Analytics on AWS – Part 2
课程大纲
简介
- Amazon EMR 简介
- Amazon EMR Serverless 架构和使用案例
- Amazon EMR 集群架构和使用案例
使用 Amazon EMR Serverless
- 如何在 Amazon EMR Serverless 上运行 Spark 作业?
使用 Amazon EMR
- 如何在 EC2 集群上创建 Amazon EMR?
- 如何创建 Amazon EMR Studio?
- 如何创建 Amazon EMR 工作区?
- 如何使用 Amazon EMR Studio Notebook 运行 Spark 作业?
资源
- 了解详情