Visão geral
O Amazon Aurora é um mecanismo de banco de dados relacional compatível com MySQL e PostgreSQL criado para a nuvem. O Aurora é totalmente gerenciado pelo Amazon Relational Database Service (RDS), que automatiza tarefas administrativas demoradas, como provisionamento de hardware, configuração do banco de dados, aplicação de patches e backups. O Aurora é desenvolvido em um sistema de armazenamento distribuído moderno e criado para fins específicos. Todos os dados são distribuídos em três zonas de disponibilidade da AWS diferentes, em centenas de nós de armazenamento, com duas cópias por zona. Os mecanismos de banco de dados compatíveis com Aurora MySQL e PostgreSQL são personalizados para aproveitar o armazenamento distribuído rápido.
Por padrão, uma consulta coloca todos os dados verificados em um único nó principal dentro do cluster do Aurora e executa todo o processamento da consulta lá. Para melhorar ainda mais o desempenho, você pode ativar a consulta paralela, uma otimização na qual o Aurora delega ou envia algumas das E/S e a computação de instruções com uso intensivo de dados para os nós de armazenamento. A consulta paralela do Aurora pode ser uma boa opção para cargas de trabalho analíticas que exigem performance rápida de instruções em tabelas grandes com dados novos. Muitas vezes, as cargas de trabalho desse tipo são de natureza operacional.
Neste laboratório, você investigará como e quando a consulta paralela é aplicada a uma instrução. Você também aprenderá como garantir que a consulta paralela seja aplicada de modo a proporcionar o maior benefício.
Objetivos
Depois de concluir este laboratório, você será capaz de:
- Entender como a consulta paralela pode beneficiar seu workload
- Entender o benefício da consulta paralela para grandes conjuntos de dados
- Determinar algumas das situações que acionam a consulta paralela
Pré-requisitos
Este laboratório requer:
- Acesso a um computador com Wi-Fi e Microsoft Windows, macOS X ou Linux (Ubuntu, SuSE ou Red Hat).
- Observação: você pode usar um tablet ou um iPad para acessar essas orientações no console do laboratório.
- Um navegador da Internet, como Chrome, Firefox ou Internet Explorer 9, ou versão superior.
- Observação: versões anteriores do Internet Explorer não são compatíveis.
- Um cliente SSH, como PuTTY.
Pré-requisitos de conhecimentos técnicos
Para concluir este laboratório, é necessário ter familiaridade com:
- A sintaxe e a operação do banco de dados MySQL
Duração
Este laboratório leva 60 minutos para ser concluído.
Serviços da AWS não usados neste laboratório
Neste ambiente de laboratório, os serviços da AWS que não forem usados serão desativados. Além disso, os recursos dos serviços usados neste laboratório são limitados ao que ele exige. Se você acessar outros serviços ou executar ações diferentes das que fazem parte deste guia de laboratório, haverá erros.
Ambiente do laboratório
Este ambiente de laboratório consiste em duas instâncias de banco de dados do Aurora em um único cluster. As instâncias têm tamanhos diferentes e são pré-carregadas com o mesmo conjunto de dados de exemplo. O ambiente também inclui uma instância do Amazon Elastic Compute Cloud (Amazon EC2) para acessar as instâncias de banco de dados e um painel do Amazon CloudWatch com widgets pré-configurados.
A imagem a seguir é um diagrama de rede do ambiente:
Cinco anos de dados de voos dos Estados Unidos, aproximadamente 30 milhões de registros, compilados pelo Office of Airline Information, Bureau of Transportation Statistics foram pré-carregados para você. Neste laboratório, você explorará várias instruções que se beneficiam da consulta paralela. Para entender melhor como a consulta paralela afeta a carga do servidor, você examinará a utilização do buffer, os tempos de resultados e os gráficos de métricas mostrados em um painel do CloudWatch.
Os conjuntos de dados usados neste laboratório foram compilados do Office of Airline Information, Bureau of Transportation Statistics, horário de chegada e partida real e programado de transportadoras dos EUA (1987-2019), disponível em: https://www.transtats.bts.gov/DatabaseInfo.asp?DB_ID=120&DB_URL=Mode_ID=1&Mode_Desc=Aviation&Subject_ID2=0.