本课程将介绍如何使用 AWS 服务构建流数据分析解决方案,这些服务包括 Amazon Kinesis 和 Amazon Managed Streaming for Apache Kafka (Amazon MSK)。Amazon Kinesis 是一项可大规模扩展且持久的实时数据流服务。Amazon MSK 提供一项安全且高度可用的完全托管式 Apache Kafka 服务。您将了解 Kinesis 和 Amazon MSK 如何与 AWS Glue 和 AWS Lambda 等 AWS 服务集成。本课程将介绍数据分析管道的流数据摄取、流存储和流处理组件。您还将了解如何在 Kinesis 和 Amazon MSK 运营中应用安全性、性能和成本管理最佳实践。
课程目标
在本课程中,您将:
- 了解现代化数据架构的特性和优势。了解 AWS 流服务如何纳入到现代化数据架构。
- 设计和实施流数据分析解决方案。
- 了解并应用合适的技术(例如压缩、分片和分区)来优化数据存储。
- 选择并部署合适的选项来摄取、转换和存储实时及近乎实时的数据。
- 为特定的业务使用案例选择合适的流、集群、主题、扩展方法和网络拓扑。
- 了解数据存储和处理如何影响获取切实可行的业务见解所需的分析和可视化机制。
- 保护静态和传输中的流数据。
- 监控分析工作负载以发现并修复问题。
- 应用成本管理最佳实践。
培训对象
本课程面向:
- 数据工程师和架构师
- 希望构建和管理实时应用程序及流数据分析解决方案的开发人员
前提条件
我们建议符合以下条件的人员参加本课程:
- 具备至少一年的数据分析经验或构建实时应用程序或流分析解决方案的直接经验。对于那些需要复习流概念的人员,我们建议查看 AWS 上的流数据解决方案白皮书。
- 已完成 Architecting on AWS 或 Data Analytics Fundamentals 课程
- 已完成 Building Data Lakes on AWS 课程
课程大纲
- 简介:数据分析和数据分析管道
- 模块 1:在数据分析管道中使用流服务
- 模块 2:AWS 流服务简介
- 模块 3:使用 Amazon Kinesis 进行实时数据分析
- 模块 4:保护、监控和优化 Amazon Kinesis
- 模块 5:在流数据分析解决方案中使用 Amazon MSK
- 模块 6:保护、监控和优化 Amazon MSK
- 模块 7:设计流数据分析解决方案
- 模块 8:在 AWS 上开发现代化数据架构