Visão geral
Este laboratório apresentará uma visão geral do Amazon Redshift. Neste laboratório, você iniciará e trabalhará com um cluster do Amazon Redshift para analisar dados de voos domésticos dos EUA.
O Amazon Redshift é um serviço de data warehouse rápido e totalmente gerenciado em escala de petabytes. Com ele, é simples e econômico analisar todos os dados com eficiência usando as ferramentas de business intelligence que você já tem. O serviço é otimizado para conjuntos de dados que variam desde algumas centenas de gigabytes a um petabyte ou mais e custa menos de USD 1 mil por terabyte por ano, ou seja, um décimo do custo das soluções tradicionais de data warehouse.
O Amazon Redshift proporciona consulta rápida e desempenho de E/S para conjuntos de dados de praticamente qualquer tamanho ao usar tecnologia de armazenamento colunar, paralelização e distribuição de consultas entre vários nós. Para facilitar o uso do Amazon Redshift, automatizamos a maioria das tarefas administrativas comuns ligadas a provisionamento, configuração, monitoramento, backup e segurança de data warehouse.
Tópicos abordados
Ao final do laboratório, você conseguirá:
- Iniciar um cluster do Amazon Redshift
- Conectar-se ao Amazon Redshift com o software-cliente SQL
- Carregar dados do Amazon S3 no Amazon Redshift
- Consultar dados do Amazon Redshift
- Monitorar o desempenho do Amazon Redshift
Pré-requisitos do laboratório
Para fazer o laboratório, é preciso ter conhecimento básico sobre bancos de dados e SQL.
Lista de ícones
Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:
- Comando: um comando que você precisa executar.
- Saída esperada: um exemplo que você pode usar para verificar a saída de um comando ou arquivo editado.
- Observação: uma sugestão, dica ou orientação importante.
- Informações adicionais: em que local encontrar mais informações.
- AVISO: uma ação que seja irreversível e que tenha potencial de afetar a falha de um comando ou processo (inclusive avisos sobre configurações que não possam ser alteradas após serem feitas).