概要
このラボでは、Amazon Redshift の概要を取り上げます。また、Amazon Redshift クラスターを起動して作業を行い、米国の国内航空路線の運航便データを分析します。
Amazon Redshift は、ペタバイトスケールの高速なフルマネージド型データウェアハウスサービスです。シンプルかつコスト効率の良い方法で、すべてのデータを既存のビジネスインテリジェンスツールで効率的に分析できます。数百ギガバイト~1 ペタバイト以上のデータセットに対して最適化されており、テラバイトあたり年間 1,000 USD 未満で運用できます。これは、従来型のデータウェアハウスソリューションのほとんどと比較して、10 分の 1 のコストです。
Amazon Redshift では、列指向ストレージのテクノロジー、ならびに複数ノード間でのクエリの並列化と分散化により、事実上すべてのサイズのデータセットに対応する高速なクエリと I/O のパフォーマンスを実現しています。データウェアハウスのプロビジョニング、設定、モニタリング、バックアップ、保護に関連する一般的な管理タスクのほとんどが自動化されるため、Amazon Redshift を簡単に使用できます。
取り上げるトピック
このラボを修了すると、以下ができるようになります。
- Amazon Redshift クラスターを起動する
- SQL クライアントソフトウェアを使用して Amazon Redshift に接続する
- Amazon S3 から Amazon Redshift にデータをロードする
- Amazon Redshift のデータに対してクエリを実行する
- Amazon Redshift のパフォーマンスをモニタリングする
ラボの前提条件
このラボを修了するには、データベースと SQL の基本的なコンセプトに関する知識が必要です。
アイコンキー
このラボでは、さまざまな種類の手順と注記への注意を促すため、各種アイコンが使用されています。以下のリストは、各アイコンの目的を説明したものです。
- コマンド: 実行する必要があるコマンドです。
- 想定される出力: 出力のサンプルであり、コマンドまたは編集済みファイルの出力を確認するときに使用します。
- 注意: ヒントや重要なガイダンスです。
- 追加情報: 詳細を確認できます。
- 警告: 元に戻すことが不可能で、コマンドやプロセスの失敗に影響を与える可能性があるアクションです。中には、いったん実行すると元に戻せない設定への警告もあります。