실습 개요
AnyCompany Consulting은 잠재 고객 이탈을 분석하는 모델을 배포해 달라고 요청했습니다. 모델 크기를 조정하기 위해 Amazon SageMaker Studio와 함께 Amazon SageMaker Pipelines 및 SageMaker Model Registry를 사용할 예정입니다.
워크플로 오케스트레이션 도구인 SageMaker Pipelines는 SageMaker와 직접 상호 작용하므로 운영 복원력과 재현성이 개선됩니다. SageMaker Studio에서는 SageMaker Pipelines를 직접 관리할 수 있습니다. 그러므로 같은 콘솔 내에서 파이프라인 실행을 시각화하고 변경할 수 있습니다.
이 실습에서는 자동화된 기계 학습(ML) 워크플로의 여러 단계를 관리합니다. 이러한 단계에는 데이터 로드, 훈련 및 튜닝, 모델 평가, 편향 탐지, 배포 등이 있습니다. 그리고 Model Registry를 사용하여 훈련된 모델을 저장합니다.
이 실습에서는 Kaggle Customer Retention Retail에서 제공되는 Customer Retention Retail 데이터세트를 사용합니다. 이 데이터세트에는 특정 매장 고객 관련 데이터(예: 주문, 주문 수량, 주문 빈도 등)가 포함되어 있습니다. 이 데이터세트를 사용하면 다양한 마케팅 전략을 기반으로 하여 고객 유지 가능성과 고객의 행동 방식을 평가할 수 있습니다.
목표
이 실습을 마치면 다음을 수행할 수 있게 됩니다.
- SageMaker 파이프라인 생성
- 파이프라인 단계와 아티팩트 확인
- 파이프라인 단계를 통해 Model Registry에 훈련된 모델 등록
아이콘 키
이 실습에서는 다양한 유형의 지침 및 참고 사항에 대한 주의를 환기하기 위해 다양한 아이콘이 사용됩니다. 각 아이콘의 목적은 다음과 같습니다.
- 참고: 힌트, 팁 또는 중요한 가이드입니다.
- 자세히 알아보기: 자세한 정보를 찾을 수 있는 위치를 나타냅니다.
- 태스크 완료: 실습의 결론 또는 요점입니다.
- 주의: 특별한 관심이 필요한 중요한 정보입니다(놓쳤다고 해도 장비 또는 데이터에 문제가 발생할 정도로 중요하지는 않지만 특정 단계를 반복해야 할 수 있음).
- 경고: 되돌릴 수 없으며 명령 또는 프로세스의 실패에 영향을 줄 수 있는 작업입니다(설정한 후 변경할 수 없는 구성에 대한 경고 포함).