이 과정은 기계 학습(ML) 수명 주기의 데이터 준비 단계 중 일부를 다룹니다. 이 과정에서는 데이터 변환에 대해 알아봅니다. 이 과정에서는 데이터 정리, 인코딩 및 특성 추출과 같은 다양한 변환 개념과 기술을 다룹니다. Amazon SageMaker Feature Store, Amazon SageMaker Data Wrangler, AWS Glue와 같은 Amazon Web Services(AWS) 서비스를 사용하여 데이터를 변환하는 방법을 알아봅니다.
- 과정 수준: 300
- 소요 시간: 60분
참고: 이 과정의 동영상에는 한국어 트랜스크립트 또는 자막이 지원되며 음성은 영어로 출력됩니다. 자막을 표시하려면 동영상 화면 우측 하단의 CC 버튼을 클릭하세요.
참고: 이 과정은 Google Chrome(최신 주요 버전 2개), Microsoft Edge(최신 주요 버전 2개), Safari(최신 주요 버전 2개)에 최적화되어 있습니다.
활동
- 온라인 자료
- 데모
- 지식 확인 질문
- 교육 과정 평가
과정 목표
- 데이터 정리 및 변환의 가치를 설명합니다.
- 부정확하거나 중복된 데이터를 처리하는 방법을 설명합니다.
- 이상값을 감지하고 처리하는 방법을 설명합니다.
- 누락된 값을 처리하는 방법을 설명합니다.
- 기본 인코딩 기술을 설명합니다.
- 특성 추출 사용 사례를 식별합니다.
- 특성 추출의 기본 개념, 이점 및 기술을 설명합니다.
- 기본적인 특성 선택 기술을 설명합니다.
- 데이터 검증 및 레이블 지정을 위한 AWS 서비스를 설명합니다.
- 데이터 시각화 및 변환을 위한 AWS 도구 및 서비스를 식별합니다.
- SageMaker Feature Store를 사용하여 데이터를 수집하고 특성을 관리하는 방법을 설명합니다.
- Amazon SageMaker Data Wrangler를 사용하여 데이터를 수집하고 변환하는 방법을 설명합니다.
- AWS Glue를 사용하여 데이터를 변환하는 방법을 설명합니다.
- 스트리밍 데이터 변환을 위한 AWS 도구 및 서비스를 식별합니다.
- Amazon EMR에서 AWS Lambda와 Apache Spark를 사용하여 스트리밍 데이터를 변환하는 방법을 설명합니다.
수강 대상
- 클라우드 아키텍트
- 기계 학습 엔지니어
권장 기술
- Amazon SageMaker 및 기타 AWS 서비스를 ML 엔지니어링에 사용한 1년 이상의 경험
- 백엔드 개발자, DevOps 개발자, 데이터 엔지니어, 데이터 과학자 등 관련 역할에서 1년 이상의 경험
- Python 등 프로그래밍 언어에 대한 기본적인 이해
- AWS ML Engineer Associate 학습 플랜의 이전 과정
과정 개요
- 섹션 1: 소개
- 강의 1: 본 과정 사용 방법
- 강의 2: 과정 개요
- 강의 3: 데이터 변환의 기초
- 섹션 2: 데이터 정리 기법
- 강의 4: 부정확하거나 중복된 데이터
- 강의 5: 데이터 이상값
- 강의 6: 불완전하거나 누락된 데이터
- 섹션 3: 범주형 인코딩 기법
- 강의 7: 범주형 인코딩
- 강의 8: 인코딩 기법
- 섹션 4: 특성 추출
- 강의 9: 특성 추출 개념
- 강의 10: 수치적 특성 추출
- 강의 11: 텍스트 특성 추출
- 강의 12: 특성 선택 기법
- 섹션 5: 데이터 변환을 위한 AWS 도구 및 서비스
- 강의 13: AWS를 사용한 데이터 레이블링
- 강의 14: AWS를 사용한 데이터 수집
- 강의 15: AWS를 사용한 데이터 변환
- 강의 16: AWS Glue를 사용한 데이터 변환
- 섹션 6: 결론
- 강의 17: 과정 요약
- 강의 18: 평가
- 강의 19: AWS에 문의하기