Aperçu
Cet atelier fournit une vue d’ensemble d’Amazon Redshift. Dans cet atelier, vous allez lancer un cluster Amazon Redshift et travailler avec ce cluster pour analyser les données de vol domestiques aux États-Unis.
Amazon Redshift est un service d’entrepôt de données rapide, entièrement géré et doté d’une capacité de plusieurs pétaoctets. Il permet d’analyser de manière efficace, simple et rentable toutes vos données grâce à vos outils d’informatique décisionnelle existants. Il est optimisé pour les ensembles de données dont la taille va de quelques centaines de giga-octets à un ou plusieurs péta-octets, et coûte moins de 1 000 USD par téra-octet et par an, soit un dixième du coût de la plupart des solutions classiques d’entreposage de données.
Amazon Redshift fournit des performances d’I/O et de requête élevées pour pratiquement toutes les tailles de jeux de données, en faisant appel à la méthode de stockage en colonnes et en exécutant les requêtes en parallèle, puis en les répartissant sur plusieurs nœuds. Nous avons conçu Amazon Redshift comme un outil simple à utiliser en automatisant la plupart des tâches d’administration associées à la mise en service, à la configuration, à la surveillance, à la sauvegarde et à la sécurisation des entrepôts de données.
Thèmes abordés
À la fin de cet atelier, vous serez en mesure d’effectuer les opérations suivantes :
- Lancer un cluster Amazon Redshift
- Vous connecter à Amazon Redshift à l’aide du logiciel client SQL
- Charger des données depuis Amazon S3 dans Amazon Redshift
- Interroger des données depuis Amazon Redshift
- Surveiller les performances d’Amazon Redshift
Prérequis de l’atelier
Pour réussir cet atelier, vous devez connaître les concepts de base des bases de données et SQL.
Signification des icônes
Cet atelier utilise de nombreuses icônes différentes pour attirer l’attention sur différents types d’instructions et de remarques. La liste suivante explique la raison d’être de chaque icône :
- Commande : une commande que vous devez exécuter.
- Sortie attendue : un exemple de sortie que vous pouvez utiliser pour vérifier la sortie d’une commande ou d’un fichier modifié.
- Remarque : un indice, une directive ou un conseil important.
- Informations complémentaires : indique où trouver plus d’informations.
- AVERTISSEMENT : une action qui est irréversible et susceptible d’avoir une incidence sur l’échec d’une commande ou d’un processus (y compris les avertissements concernant les configurations ne pouvant pas être modifiées après leur mise en place).