이 과정은 기계 학습(ML) 수명 주기의 데이터 준비 단계 중 일부를 다룹니다. 이 과정에서는 편향 완화 및 데이터 보안 전략을 비롯한 데이터 검증 전략에 대해 알아봅니다. 또한 AWS Glue DataBrew와 AWS Glue Data Quality를 비롯하여 데이터 검증에 도움이 되는 몇 가지 Amazon Web Services(AWS) 서비스도 검토해 보겠습니다. 또한 데이터세트 분할, 셔플링, 증강 및 구성과 같은 데이터 준비 및 구성의 마지막 단계에 대해서도 학습하여 모델 훈련 리소스에 로드할 수 있습니다.
- 과정 수준: 300
- 소요 시간: 45분
참고: 이 과정의 동영상에는 한국어 트랜스크립트 또는 자막이 지원되며 음성은 영어로 출력됩니다. 자막을 표시하려면 동영상 화면 우측 하단의 CC 버튼을 클릭하세요.
참고: 이 과정은 Google Chrome(최신 주요 버전 2개), Microsoft Edge(최신 주요 버전 2개), Safari(최신 주요 버전 2개)에 최적화되어 있습니다.
활동
- 온라인 자료
- 데모
- 지식 확인 질문
- 과정 평가
과정 목표
- 데이터 무결성을 보장하는 것이 중요한 이유를 설명합니다.
- 기본적인 사전 훈련 편향 지표를 식별합니다.
- 데이터세트의 클래스 불균형을 해결하기 위한 전략을 설명합니다.
- 데이터 품질을 검증하기 위한 주요 AWS 서비스를 설명합니다.
- AWS 도구를 사용하여 데이터 편향의 원인을 파악하고 완화합니다.
- AWS 서비스를 사용하여 데이터를 암호화하는 기술을 설명합니다.
- 규정 준수 요구 사항의 의미를 파악합니다.
- 데이터세트를 분할, 셔플링, 증강하는 가치와 기술을 설명합니다.
- 모델 훈련에 사용된 데이터 형식을 식별합니다.
- 모델 훈련 데이터 구성을 위한 AWS 도구와 서비스를 식별합니다.
- 모델 훈련 리소스에 데이터를 로드하기 위해 데이터를 구성하는 방법을 설명합니다.
수강 대상
- 클라우드 아키텍트
- 기계 학습 엔지니어
권장 기술
- Amazon SageMaker 및 기타 AWS 서비스를 ML 엔지니어링에 사용한 1년 이상의 경험.
- 백엔드 소프트웨어 개발자, DevOps 개발자, 데이터 엔지니어 또는 데이터 과학자 등 관련 직무에서 최소 1년 이상의 경험.
- Python 등 프로그래밍 언어에 대한 기본적인 이해.
- AWS ML Engineer Associate 학습 플랜의 이전 과정.
과정 개요
- 섹션 1: 소개
- 강의 1: 본 과정 사용 방법
- 강의 2: 과정 개요
- 강의 3: 데이터 검증의 기초
- 섹션 2: 데이터 검증
- 강의 4: 클래스 불균형 문제 해결
- 강의 5: 데이터 검증 및 편향 완화를 위한 AWS 도구 및 서비스
- 강의 6: Amazon SageMaker Clarify를 사용하여 편향 식별 및 완화
- 강의 7: 데이터 보안 및 규정 준수
- 섹션 3: 데이터 준비의 마지막 단계
- 강의 8: 데이터세트 분할, 셔플링 및 증강
- 강의 9: 모델링 훈련을 위한 데이터 구성
- 섹션 4: 결론
- 강의 10: 과정 요약
- 강의 11: 평가
- 강의 12: AWS에 문의하기