Panoramica del laboratorio
In questo laboratorio, dovrai elaborare il prototipo di un flusso di lavoro video con i servizi di intelligenza artificiale (AI) di Amazon Web Services (AWS). Il flusso di lavoro genererà automaticamente didascalie, sottotitoli e tracce audio in lingue alternative. Per eseguire queste attività , utilizzerai Amazon Transcribe, Amazon Translate e Amazon Polly.
Flusso di lavoro e requisiti
Per questo laboratorio, disponi di una risorsa video esistente con audio. Vuoi aumentare il pubblico e rispettare le direttive includendo didascalie, sottotitoli e tracce audio in lingue alternative. Vuoi che questo sistema sia automatizzato, ma prima devi elaborare il prototipo del flusso di lavoro.
Requisiti:
- Usa un video con audio come input
- Trascrivi l’audio utilizzando un servizio automatizzato
- Usa la trascrizione per creare un file di didascalie in un formato supportato
- Traduci la trascrizione creata in precedenza
- Usa la traduzione per creare un file di sottotitoli in un formato supportato
- Usa l’opzione da testo a voce per generare un file audio opportunamente sincronizzato della trascrizione tradotta
- Combina il video e l’audio originali, il file delle didascalie, il file dei sottotitoli e il file audio generato in un unico stack Apple HTTP Live Streaming (HLS) pronto per lo streaming
In base a ciò che sai sui servizi multimediali e di intelligenza artificiale di AWS, hai definito un flusso di lavoro per il tuo processo simile a questo:
Flusso di lavoro per questo laboratorio
Utilizzerai i servizi di intelligenza artificiale di AWS per generare automaticamente i componenti necessari per la creazione di didascalie, sottotitoli e tracce audio in lingue alternative per il video originale. Unirai quindi i componenti in uno stack HLS Apple utilizzando AWS Elemental MediaConvert.
Flusso di dati per questo laboratorio
Argomenti trattati
Alla fine di questo laboratorio sarai in grado di:
- Costruire un processo per automatizzare la generazione di didascalie, sottotitoli e tracce audio in lingue alternative utilizzando i tre servizi di intelligenza artificiale di AWS – Amazon Transcribe, Amazon Translate e Amazon Polly
- Generare la trascrizione di un video utilizzando Amazon Transcribe
- Tradurre la trascrizione in una lingua alternativa utilizzando Amazon Translate
- Trasformare la trascrizione in una lingua alternativa in audio in una lingua alternativa utilizzando Amazon Polly
- Costruire uno stack Apple HLS utilizzando AWS Elemental MediaConvert
- Verificare che l’audio e le didascalie/i sottotitoli funzionino come previsto in un riproduttore video
Competenze tecniche preliminari
Per completare correttamente questo laboratorio, è necessario avere familiarità con la navigazione di base della Console di gestione AWS ed essere in grado di modificare gli script utilizzando un editor di testo.