What you'll learn:
- Fundamentos da biblioteca NumPy para Data Science
- Álgebra Linear com NumPy
- Módulo Random do NumPy
- Criação de DataFrames e Series
- Inspeção de dados com Pandas
- Seleção de linhas e colunas (loc e iloc)
- Seleção booleana de dados
- Aplicação de funções
- Iteração em DataFrames e Series
- Limpeza de dados com Pandas
- Manipulação de dados com Pandas
- Funções de data e horas
- Transformação de dados com Pandas
- GroupBy, Merging/Joining e Concatenação de dados
- Tratamento de missing
- Estatística descritiva
- Leitura e escrita de arquivos com Pandas
- Matplotlib
- Seaborn
- Visualização de dados com Pandas
- Introdução à Machine Learning
Esse é um curso completo para a formação de Cientista de Dados, com mais de 250 exercícios de A-Z, abordando desde os conceitos mais básicos até os mais avançados. Foca em metodologias ativas, onde o aluno é protagonista nesse processo, assim, trazemos diversos exercícios resolvidos, notebooks de resumo dos conteúdos e muito mais, com o foco na aprendizagem da programação baseada na prática e simulação de problemas reais (como limpeza de dados, tratamento de missings, separação de dados em treino e teste, agrupamento e junção de datasets, dentre outros).
Neste sentido, o curso possui exercícios resolvidos sobre as principais bibliotecas do Python para Data Science:NumPy, Pandas, Matplotlib e Seaborn. Além do que, busca resgatar conceitos elementares da Álgebra Linear, por meio da biblioteca NumPy.
Em linhas gerais, o curso apresenta exercícios que englobam as principais funções do NumPy para Data Science, como funções de agregação, definição de matrizes, operações matricias, dentre outras. Quanto ao Pandas, busca-se oferecer um panorama geralpartindo da definição de Series e DataFrames, inspeção de datasets, seleção booleana, filtro de linhas de colunas, remoção de linhas e colunas, tratamento de dados ausentes, funções de agrupamento e junção, abertura e escrita de arquivos, funções de estatística descritiva, dentre outros tópicos.
Por fim, apresentam-se diversos problemas relacionados a visualização de dados, com as bibliotecas Matplotlib e Seaborn, a partir de datasets clássicos. Noções de Séries temporais e Finanças também são introduzidas. Há ainda exemplos de como preparar um dataset para um projeto de Machine Learning.
O curso possui ainda um E-book de fundamentos de Python, abordando os seguintes tópicos:
Primeiros passos com Python!
Declaração de variáveis e tipos primitivos
Strings
Operadores
Estruturas condicionais
Estruturas de repetição
Estruturas de dados