Técnicas e Algoritmos em Ciência de Dados
Introdução: IA, Aprendizado de Máquina, Ciência de Dados; Problemas de classificação e regressão; Métodos para avaliar o desempenho de generalização; Regressão linear; Modelos lineares regularizados; Regressão logística; Redes neurais; Árvores de decisão; Ensemble learning e florestas aleatórias; Técnicas de aprendizagem não supervisionadas, Clustering; Técnicas para redução de dimensionalidade. Ferramentas para Computação Científica e Ciência de Dados: numpy, pandas, scikit-learn. Em geral, implementação dos algoritmos acima em python.
Informações Básicas
Carga horária
60
Pré-requisito
Introdução à Ciência de Dados, Linguagens de Programação, Análise Exploratória de Dados e Visualização
Obrigatória:
- Provost Foster, Fawcett Tom. Data Science para Negócios. O que Você Precisa Saber Sobre Mineração de Dados e Pensamento Analítico de Dados. 2016.
- Wes McKinney. Python for Data Analysis O'Reilly Media.
- Dean Abbott. Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst
Complementar:
- Carvalho, André Carlos Ponce de Leon Ferreira de; Faceli, Katti; Lorena, Ana Carolina; Gama, João. Inteligência Artificial - Uma Abordagem de Aprendizado.
- O'Neil, Cathy. Rachel Schutt. Doing Data Science. O'Reilly Media, Inc. 2013.
- The Scipy community. Numpy Manual. 2017 <https://docs.scipy.org/doc/numpy-1.13.0/contents.html>
- Dan Saber. A Dramatic Tour through Python’s Data Visualization Landscape (including ggplot and Altair) <https://dsaber.com/2016/10/02/a-dramatic-tour-through-pythons-data-visualization-landscape-including-ggplot-and-altair/>
- Jupyter Team. The Jupyter notebook User Documentation. <https://jupyter-notebook.readthedocs.io/en/stable/>