이 과정에서는 중점을 두어야 하는 핵심 성과 지표(KPI)를 비롯하여, 모니터링 및 최적화의 중요성을 살펴봅니다. 이 과정에서는 인프라 모니터링 및 최적화에 사용할 수 있는 도구에 대해 설명합니다. 이러한 도구에는 Amazon CloudWatch, AWS X-Ray, Amazon QuickSight, AWS CloudTrail, Amazon EventBridge, AWS Compute Optimizer, Amazon SageMaker Inference Recommender 등이 포함됩니다. ML 솔루션의 맥락에서 보았을 때 이 과정에서는 AWS 과금 정보 및 비용 관리, AWS Budgets, AWS Cost Explorer, AWS Trusted Advisor 같은 AWS 비용 분석 도구도 살펴봅니다.
- 과정 수준: 고급
- 소요 시간: 2시간 30분
참고: 이 과정의 동영상에는 한국어 트랜스크립트 또는 자막이 지원되며 음성은 영어로 출력됩니다. 자막을 표시하려면 동영상 화면 우측 하단의 CC 버튼을 클릭하세요.
참고: 이 과정은 Google Chrome(최신 주요 버전 2개), Microsoft Edge(최신 주요 버전 2개), Safari(최신 주요 버전 2개)에 최적화되어 있습니다.
활동
- 온라인 자료
- 실습
- 지식 확인 질문
과정 목표
- ML 인프라 및 주요 성능 지표 모니터링의 중요성을 설명합니다.
- CloudWatch Logs 및 경보를 구성하고 사용하여 리소스 문제를 해결하고 분석합니다.
- 지연 시간 및 성능 문제를 해결하는 데 사용할 수 있는 모니터링 및 관찰성 도구를 파악합니다.
- 대시보드를 설정하여 기계 학습 인프라의 성능 지표를 모니터링합니다.
- CloudTrail을 사용하여 API 직접 호출과 관련된 활동을 기록, 모니터링, 보관하는 방법을 설명합니다.
- SageMaker Inference Recommender로 인스턴스 패밀리를 적정 규모로 조정하는 방법을 시연합니다.
- Compute Optimizer를 사용하여 인스턴스 패밀리를 적절 규모로 조정하는 방법을 시연합니다.
- 비용 및 성능에 대한 용량 문제를 파악하고 해결합니다.
- AWS 비용 분석 도구의 기능을 파악하고 설명합니다.
- Amazon SageMaker용 기계 학습 절감형 플랜의 이점과 옵션을 설명합니다.
- 비용 최적화를 위한 추가 리소스 및 모범 사례를 파악합니다.
수강 대상
- 클라우드 아키텍트
- 기계 학습 엔지니어
권장 기술
- SageMaker 및 기타 AWS 서비스를 ML 엔지니어링에 사용한 1년 이상의 경험
- 백엔드 개발자, DevOps 개발자, 데이터 엔지니어 또는 데이터 과학자 등 관련 역할에서 1년 이상의 경험
- Python 등 프로그래밍 언어에 대한 기본적인 이해
- AWS ML Engineer Associate 학습 플랜의 이전 과정 이수
과정 개요
- 섹션 1: 소개
- 강의 1: 본 과정 사용 방법
- 강의 2: 과정 개요
- 섹션 2: 인프라 모니터링
- 강의 3: ML 인프라 모니터링의 중요성
- 강의 4: 성능 지표 모니터링
- 강의 5: 모니터링 및 관찰성
- 강의 6: 성능 및 지연 시간 모니터링 도구
- 강의 7: 관찰성 및 ML 솔루션 감사
- 강의 8: 대시보드 설정
- 섹션 3: 인프라 최적화
- 강의 9: ML 솔루션용 컴퓨팅 인프라를 적정 규모로 조정
- 강의 10: 데모: Amazon SageMaker Inference Recommender
- 섹션 4: 비용 최적화
- 강의 11: 모니터링 비용 절감
- 강의 12: 용량, 비용, 성능의 균형 맞추기
- 강의 13: ML 솔루션과 함께 AWS 비용 관리 도구 사용
- 강의 14: ML 인프라 비용 최적화를 위한 구매 옵션
- 섹션 5: 마무리
- 강의 15: 과정 요약
- 강의 16: 평가
- 강의 17: AWS에 문의하기