概览
本实验将提供对 Amazon Redshift 的概要介绍。在本实验中,您将启动并使用 Amazon Redshift 集群来分析美国国内航班数据。
Amazon Redshift 是一种快速的完全托管式 PB 级数据仓库服务,它让您可以通过简单而经济高效的方式使用现有商业智能工具来高效分析所有数据。它针对从几百 GB 到 1PB 或更大的数据集进行了优化,且每年每 TB 的费用不到 1,000 USD,仅为最传统的数据仓库解决方案成本的十分之一。
通过使用列式存储技术及在多个节点间进行并行分布式查询,Amazon Redshift 可实现快速的查询及输入/输出性能,几乎适用于任何大小的数据集。通过让与预置、配置、监控、备份及保护数据仓库相关的常用管理任务实现自动化,我们让 Amazon Redshift 变得易于使用。
涵盖的主题
在本实验结束时,您将能够:
- 启动 Amazon Redshift 集群
- 使用 SQL 客户端软件连接到 Amazon Redshift
- 将数据从 Amazon S3 加载到 Amazon Redshift
- 查询 Amazon Redshift 中的数据
- 监控 Amazon Redshift 的性能
实验先决条件
要成功完成本实验,您应该熟悉数据库和 SQL 的基本概念。
图标键
本实验中使用了不同图标,以提醒大家注意各种类型的说明和备注。下面的列表解释了每个图标的用途:
- 命令:您必须运行的命令。
- 预期输出:您可以用来验证命令或已编辑文件输出的示例输出。
- 注意:一项提示、技巧或重要指导。
- 附加信息:查找详细信息的位置。
- 警告:提醒这是一项不可逆转且可能造成命令或进程失败的操作(包括提醒配置在完成后无法更改的警告)。