Visão geral do laboratório
Normalmente, sintetizar falas não é fácil. Nem sempre é possível garantir que, quando uma aplicação lê cada letra de uma sentença, o resultado fará sentido. Desafios comuns de aplicações de conversão de texto em fala incluem:
- Palavras escritas da mesma forma, mas pronunciadas de maneira diferente: I live in Las Vegas (Eu vivo em Las Vegas) em comparação a This presentation broadcasts live from Las Vegas (Transmitido ao vivo de Las Vegas).
- Normalização do texto: desambiguação de abreviações, acrônimos e unidades: St., que pode significar Street (Rua) ou Saint (Santo).
- Converter texto para fonemas em idiomas com mapeamento complexo como, em inglês, tough (difícil), through (através) e though (embora). Neste exemplo, partes semelhantes de palavras diferentes podem ser pronunciadas de forma diferente dependendo da palavra e do contexto.
- Palavras estrangeiras (déjà vu), nomes próprios (François Hollande) e gírias (ASAP, LOL).
O Amazon Polly oferece uma funcionalidade de síntese de fala que supera esses desafios, permitindo que você se concentre em criar aplicações que usam a conversão de texto em fala em vez de lidar com desafios de interpretação.
O Amazon Polly transforma texto em fala realista. Ele permite criar aplicações que falam com naturalidade, o que possibilita o desenvolvimento de novas categorias de produtos com recursos de voz. O Amazon Polly é um serviço do Amazon AI que usa tecnologias avançadas de aprendizado profundo para sintetizar falas que soam como a voz humana. Ele inclui dezenas de vozes realistas distribuídas em vários idiomas, o que permite selecionar a voz ideal e criar aplicativos com recursos de fala que funcionam em vários países diferentes.
Além disso, o Amazon Polly oferece tempos de resposta rápidos e com a uniformidade necessária para possibilitar diálogos interativos em tempo real. Você pode salvar e armazenar em cache o áudio das falas do Polly para reprodução off-line ou redistribuição. Em outras palavras, o que você converter e salvar será seu. Não há nenhuma taxa adicional de conversão de texto em fala por usar a fala. O Polly também é fácil de usar. Basta enviar o texto que você quer converter em fala para a API do Amazon Polly. O Amazon Polly devolverá rapidamente o stream de áudio para a aplicação para reprodução imediata ou armazenamento em um formato de arquivo de áudio-padrão, como o MP3.
Neste laboratório, você criará uma aplicação básica e sem servidor que usa o Amazon Polly para converter texto em fala. A aplicação tem uma interface de usuário simples que aceita textos em diferentes idiomas e os converte em arquivos de áudio que podem ser reproduzidos em um navegador da web. Este laboratório usa publicações de blog, mas você pode usar qualquer tipo de texto. Por exemplo, você pode usar a aplicação para ler receitas enquanto prepara uma refeição ou para ler notícias e livros enquanto dirige ou anda de bicicleta.
Objetivos
Ao final deste laboratório, você vai conseguir:
- Criar uma tabela do Amazon DynamoDB para armazenar dados
- Criar uma API RESTful do Amazon API Gateway
- Criar funções do AWS Lambda acionadas por API Gateway.
- Conectar as funções do AWS Lambda com o Amazon Simple Notification Service (SNS).
- Usar o Amazon Polly para sintetizar fala em diversos idiomas e vozes
Lista de ícones
Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:
- Comando: um comando que você precisa executar.
- Saída esperada: um exemplo que você pode usar para verificar a saída de um comando ou arquivo editado.
- Observação: uma sugestão, dica ou orientação importante.
- Atenção: informações de interesse ou importância especial (não tão importantes a ponto de causar problemas com o equipamento ou dados caso você não as veja, mas que podem resultar na necessidade de repetir determinadas etapas).
- Aviso: uma ação que seja irreversível e que tenha potencial de afetar a falha de um comando ou processo (inclusive avisos sobre configurações que não possam ser alteradas após serem feitas).
- Tarefa concluída: um ponto de conclusão ou de resumo no laboratório.