Este curso abrange parte da fase de preparação de dados do ciclo de vida de machine learning (ML). Você aprenderá estratégias de validação de dados, como aquelas para redução viés e segurança de dados. Você também analisará alguns serviços da Amazon Web Services (AWS) que podem auxiliar na validação de dados, como o AWS Glue DataBrew e o AWS Glue Data Quality. Você também aprenderá as etapas finais de preparação e configuração de dados, como divisão, embaralhamento, aumento e configuração de conjunto de dados para carregá-los no recurso de treinamento do modelo.
- Nível do curso: 300
- Duração: 45 minutos
Atividades
- Materiais on-line
- Uma demonstração
- Perguntas do teste de conhecimento
- Uma avaliação do curso
Objetivos do curso
- Explicar a importância de garantir a integridade dos dados.
- Identificar as métricas fundamentais de viés pré-treinamento.
- Descrever estratégias para resolver o desequilíbrio de classes nos conjuntos de dados.
- Descrever serviços da AWS principais para validar a qualidade dos dados.
- Usar ferramentas da AWS para identificar e reduzir origens de viés nos dados.
- Descrever técnicas de uso de serviços da AWS para criptografar dados.
- Identificar implicações de requisitos de conformidade.
- Descrever o valor e a técnica de divisão, embaralhamento e aumento de conjuntos de dados.
- Identificar formatos de dados usados no treinamento do modelo.
- Identificar ferramentas e serviços da AWS para configuração de dados de treinamento do modelo.
- Descrever como configurar dados para carregá-los em um recurso de treinamento do modelo.
Público-alvo
- Arquitetos de nuvem
- Engenheiros de machine learning
Habilidades recomendadas
- Pelo menos um ano de experiência de uso do Amazon SageMaker e de outros serviços da AWS de engenharia de ML.
- Pelo menos um ano de experiência em uma função relacionada, como desenvolvedor de software back-end, desenvolvedor DevOps, engenheiro de dados ou data scientist.
- Uma compreensão fundamental de linguagens de programação, como Python.
- Cursos anteriores no Plano de aprendizado AWS ML Engineer Associate.
Conteúdo do curso
- Seção 1: Introdução
o Lição 1: Como usar este curso
o Lição 2: Visão geral do curso
o Lição 3: Fundamentos de validação de dados
- Seção 2: Validar os dados
o Lição 4: Resolver desequilíbrio de classes
o Lição 5: Ferramentas e serviços da AWS para validação de dados e redução de viés
o Lição 6: Identificar e reduzir viés com o Amazon SageMaker Clarify
o Lição 7: Segurança de dados e conformidade
- Seção 3: Etapas finais da preparação de dados
o Lição 8: Divisão, embaralhamento e aumento de conjunto de dados
o Lição 9: Configurar dados para treinamento do modelo
- Seção 4: Conclusão
o Lição 10: Resumo do curso
o Lição 11: Avaliação
o Lição 12: Entrar em contato