Arquivos do curso de Data Science e Machine Learning com Python na Udemy, clique aqui para acessá-lo.
- Parte 1 - Classificação
- Pré-processamento dos dados: visualização dos dados, tratamento da base de dados, divisão entre previsores e classe, escalonamento dos atributos, LabelEncoder e OneHotEncode;
- Aprendizagem bayesiana;
- Aprendizagem por árvores de decisão;
- Aprendizagem baseada em instâncias;
- Regressão logística;
- Máquinas de vetores de suporte (SVM);
- Redes neurais artificiais;
- Avaliação de algoritmos de classificação;
- Combinação e rejeição de classificadores.
- Parte 2 - Regressão
- Regressão linear e Múltipla;
- Regressão polinomial;
- Regressão com árvores de decisão;
- Regressão com random forest;
- Regressão com vetores de suporte;
- Regressão com redes neurais.
- Parte 3 - Regras de Associação
- Algoritmo apriori;
- Algoritmo ECLAT.
- Parte 4 - Agrupamento (clustering)
- Agrupamento com k-means;
- Agrupamento hierárquico;
- DBSCAN.
- Parte 5 - Tópicos Complementares
- Aprendizagem por reforço com Q-Learning;
- Processamento de Linguagem Natural com spaCy e NLTK;
- Visão computacional;
- Tratamento de dados desbalanceados;
- Seleção de atributos;
- Redução de dimensinalidade;
- Detecção de outliers;
- Séries temporais.
É uma base de dados histórica no qual nos fornece a renda (income), idade (age) e dívida (loan) de 2000 pessoas, junto com a informação se pagaria ou não o empréstimo (default). O objetivo aqui era treinar o algoritmo para prever se a pessoa pagaria ou não o empréstimo. Essa foi uma base de dados com valores faltantes (3 registros) e inconsistentes (3 registros) que precisaram ser tratados. A base usada foi adaptada deste link.
Uma base de dados no qual fornece informações sobre cada pessoa (idade, trabalho, educação, ocupação, relacionamento, raça...) com 32562 registros, junto com a informação se a renda anual seria >50K ou <50K de dólares. O objetivo aqui era prever a renda da pessoa com base em algumas informações/características sobre a pessoa. Ela pode ser encontrada clicando aqui.
Algoritmo | Credit Data | Census |
---|---|---|
Naïve Bayes | 93,8% | 47,6% |
Árvores de decisão | 98,2% | 81,0% |
Random Forest | 98,6% | 85,0% |
Regras | 97,4% | 78,9% |
Majority learner | 85,8% | 75,9% |
KNN | 98,6% | 82,9% |
Regressão logística | 94,6% | 84,9% |
SVM | 98,8% | 85,0% |
Redes Neurais | 99,8% | 81,7% |
Em construção...