개요
이 실습에서는 Amazon Redshift의 개요를 제공합니다. 이 실습에서는 Amazon Redshift 클러스터를 시작하고 사용하여 미국 국내선 데이터를 분석합니다.
Amazon Redshift는 페타바이트 규모의 빠른 완전관리형 데이터 웨어하우스 서비스로서, 간단하고 비용 효율적으로 모든 데이터를 기존 비즈니스 인텔리전스 도구를 사용하여 분석할 수 있게 해 줍니다. 몇 백 기가바이트에서 페타바이트 이상에 이르는 데이터 집합에 최적화되어 있으며, 대부분의 기존 데이터 웨어하우징 솔루션의 10분의 1 정도인 연간 1,000 USD 미만의 비용(테라바이트당)으로 사용할 수 있습니다.
Amazon Redshift는 열 형식 스토리지 기술을 사용하고 다중 노드로 쿼리를 병렬 처리하고 배포하여 거의 모든 크기의 데이터 집합에 대해 빠른 쿼리 및 I/O 성능을 제공합니다. 또한 Amazon Redshift는 데이터 웨어하우스의 프로비저닝, 구성, 모니터링, 백업 및 보안 유지와 관련된 일반적인 관리 태스크를 자동화하여 사용이 쉽습니다.
이 실습에서 다루는 주제
이 실습을 마치면 다음을 수행할 수 있습니다.
- Amazon Redshift 클러스터 시작
- SQL 클라이언트 소프트웨어를 사용하여 Amazon Redshift에 연결
- Amazon S3에서 Amazon Redshift로 데이터 로드
- Amazon Redshift에서 데이터 쿼리
- Amazon Redshift 성능 모니터링
실습 사전 조건
이 실습을 성공적으로 완료하려면 데이터베이스와 SQL의 기본 개념에 익숙해야 합니다.
아이콘 설명
이 랩에서는 다양한 유형의 지침 및 참고 사항에 대한 주의를 환기하기 위해 다양한 아이콘이 사용됩니다. 다음 목록에서는 각 아이콘의 목적을 설명합니다.
- 명령: 실행해야 하는 명령입니다.
- 예상 출력: 명령 또는 편집된 파일의 출력을 확인하는 데 사용할 수 있는 샘플 출력입니다.
- 참고: 힌트, 팁 또는 중요한 가이드입니다.
- 추가 정보: 자세한 정보를 찾을 수 있는 위치입니다.
- 경고: 되돌릴 수 없으며 명령 또는 프로세스의 실패에 영향을 줄 수 있는 작업입니다(설정한 후 변경할 수 없는 구성에 대한 경고 포함).