概要
Amazon Aurora は、クラウド向けに構築され、MySQL および PostgreSQL との互換性があるリレーショナルデータベースエンジンです。Aurora は Amazon Relational Database Service (RDS) を使ったフルマネージドサービスであるため、ハードウェアのプロビジョニング、データベースのセットアップ、パッチ適用、バックアップといった時間のかかる管理タスクが自動化されます。Aurora は、最新の、専用の分散ストレージシステム上に構築されています。すべてのデータは異なる 3 つの AWS アベイラビリティーゾーンに分散され、数百のストレージノードに分散されて、ゾーンごとに 2 つのコピーを持ちます。Aurora の MySQL および PostgreSQL と互換性があるデータベースエンジンは、高速の分散ストレージを利用するようにカスタマイズされています。
デフォルトでは、スキャンしたすべてのデータはクエリにより Aurora クラスター内の 1 つのヘッドノードにまとめられ、そこですべてのクエリ処理が実行されます。パフォーマンスをさらに向上させるために、パラレルクエリを有効にして最適化することができます。Aurora により、大量のデータを扱うステートメントの I/O やコンピューティングの一部がストレージノードに委任またはプッシュダウンされます。Aurora のパラレルクエリは、最新のデータを含む大きなテーブルでの高速なステートメントパフォーマンスを必要とする分析ワークロードに適しています。このタイプのワークロードの多くはオペレーションに関するものです。
このラボでは、パラレルクエリがステートメントに適用される方法とタイミングを学習します。また、パラレルクエリが最適なケースで適用されていることを確認する方法についても学習します。
目標
このラボを修了すると、次のことができるようになります。
- パラレルクエリがどのようにワークロードに役立つかを理解する
- 大規模なデータセットでパラレルクエリを利用するメリットを理解する
- パラレルクエリがトリガーされる状況を判断する
前提条件
このラボには以下が必要です。
- Microsoft Windows、macOS X、Linux (Ubuntu、SuSE、Red Hat) のいずれかが搭載されている Wi-Fi 対応ノートパソコンの利用環境
- 注意: iPad またはタブレット端末を使用して、ラボのコンソールの手順にアクセスできます。
- Chrome、Firefox、IE9 以降などのインターネットブラウザ
- 注意: これより前のバージョンの Internet Explorer はサポート対象外です。
- PuTTY などの SSH クライアント。
技術知識の前提条件
このラボを修了するには、以下に慣れている必要があります。
- MySQL データベースの構文とオペレーション
所要時間
このラボの所要時間は 60 分です。
このラボで使用しない AWS のサービス
ラボ環境では、このラボで使用しない AWS のサービスにはアクセスできません。また、このラボで使用する各種サービスの機能は、ラボで必要なものに制限されています。このラボガイドで指定されていないサービスを使用したりアクションを実行したりすると、エラーが発生することがあります。
ラボ環境
このラボ環境では、1 つのクラスター内に 2 つの Aurora データベースインスタンスが作成されています。これらのインスタンスはサイズが異なり、同じサンプルデータセットが事前ロードされています。この環境には、データベースインスタンスにアクセスするための Amazon Elastic Compute Cloud (Amazon EC2) インスタンスと、事前設定済みのウィジェットを備えた Amazon CloudWatch ダッシュボードも含まれています。
次の図は、環境のネットワーク図です。
米国運輸統計局の航空情報庁には、約 3,000 万件に及ぶ米国の 5 年間のフライトデータがまとめられています。このデータがラボ用に事前ロードされています。このラボでは、パラレルクエリのメリットを得られるいくつかのステートメントについて学習します。パラレルクエリがサーバーの負荷に与える影響をよく理解するために、CloudWatch ダッシュボードに表示されるバッファ使用率、結果時間、メトリクスグラフを確認します。
このラボで使用するデータセットは、航空情報局、運輸統計局、米国のキャリア予定および実際の到着時刻と出発時刻 (1987 年~2019 年) によってまとめられています。https://www.transtats.bts.gov/DatabaseInfo.asp?DB_ID=120&DB_URL=Mode_ID=1&Mode_Desc=Aviation&Subject_ID2=0 をご覧ください。