실습 개요
이 실습에서는 Amazon Web Services(AWS) 인공 지능(AI) 서비스를 사용하여 비디오 워크플로의 프로토타입을 생성합니다. 이 워크플로는 자동으로 캡션, 대체 언어 자막, 대체 언어 오디오 트랙을 생성합니다 이 과제를 달성하기 위해 Amazon Transcribe, Amazon Translate, Amazon Polly를 사용합니다.
워크플로 및 요구 사항
이 실습을 위해 오디오가 포함된 기존 비디오 자산이 제공되었습니다. 캡션, 대체 언어 자막, 대체 언어 오디오 트랙을 포함하여 사용자를 늘리고 규정을 충족하려고 합니다. 이 시스템을 자동화하려면 먼저 워크플로의 프로토타입을 생성해야 합니다.
요구 사항:
- 오디오가 포함된 비디오를 입력으로 사용
- 자동화된 서비스를 사용하여 오디오 트랜스크립트 생성
- 트랜스크립트를 사용하여 허용되는 형식으로 캡션 파일 생성
- 이전에 생성된 트랜스크립트 번역
- 번역을 사용하여 허용되는 형식으로 자막 파일 생성
- 텍스트 음성 변환을 사용하여 번역된 트랜스크립트의 적절한 타이밍이 지정된 오디오 파일 생성
- 원본 비디오 및 오디오, 캡션 파일, 자막 파일, 생성된 오디오 파일을 스트리밍 가능한 단일 Apple HTTP Live Streaming(HLS) 스택으로 결합
AWS AI 및 미디어 서비스에 대한 지식을 기반으로 다음과 비슷한 프로세스 워크플로를 정의했습니다.
이 실습의 워크플로
AWS AI 서비스를 사용하여 원본 비디오의 캡션, 대체 언어 자막, 대체 언어 오디오 트랙 생성에 필요한 구성 요소를 자동으로 생성합니다. 그런 다음 AWS Elemental MediaConvert룰 사용하여 구성 요소를 Apple HLS 스택으로 스티칭합니다.
이 실습의 데이터 흐름
이 실습에서 다루는 주제
이 실습을 마치면 다음을 수행할 수 있습니다.
- 세 가지 AWS AI 서비스(Amazon Transcribe, Amazon Translate, Amazon Polly)를 사용하여 캡션, 대체 언어 자막, 대체 언어 오디오 트랙 생성을 자동화하는 프로세스 구성
- Amazon Transcribe를 사용하여 비디오의 트랜스크립트 생성
- Amazon Translate를 사용하여 트랜스크립트를 대체 언어로 번역
- Amazon Polly를 사용하여 대체 언어 트랜스크립트를 대체 언어 오디오로 변환
- AWS Elemental MediaConvert를 사용하여 Apple HLS 스택 구성
- 비디오 플레이어에서 오디오 및 캡션/자막이 의도대로 작동하는지 확인
필수 기술 지식
이 실습을 성공적으로 마치려면 AWS 관리 콘솔의 기본적인 사용법과 텍스트 편집기를 사용한 스크립트 편집에 익숙해야 합니다.