Laboratório de Ciência de Dados
Código
01060999Créditos ECTS
6Objetivos
1. Conhecer principais conceitos e metodologias em Ciência de Dados.
2. Saber explorar dados e construir visualizações gráficas.
3. Conhecer e aprender a aplicar métodos simples de aprendizagem estatística.
4. Criar e utilizar modelos de árvores de decisão e bayesianos.
5. Métodos de avaliação de modelos supervisionados.
6. Adquirir aptidões na utilização do R e do Python em aplicações de Ciência de Dados.
Programa
1. Introdução aos Conceitos e metodologias de Ciência de Dados
2. Utilização de ambientes de programação em R e Python.
3. Identificação de fontes de dados, exploração, pré-processamento e visualização de dados.
4. Introdução à aprendizagem estatística supervisionada.
5. Árvores de decisão para regressão e classificação.
6. Método Naive Bayes para classificação.
7. Métodos de avaliação com duas amostras e validação cruzada.
Métodos de Ensino
Nas sessões teóricas é utilizado o método expositivo e demonstrativo, com o recurso a ajudas visuais e a exemplos. Nas sessões de laboratório, os alunos desenvolvem projetos com base em guiões e com acompanhamento do docente, permitindo que trabalhem de forma autónoma, mas supervisionada. Todos os materiais de apoio são disponibilizados no Moodle, sendo esta ferramenta igualmente usada para entrega e discussão dos projetos.
Bibliografia
Essencial
- McKinney, W. (2017). Python for Data Analysis (2.a ed.). O’Reilly Media.
- Keen, K.J.. (2018). Graphics for Statistics and Data Analysis with R (2.a ed.). CRC Press.
- James, G, Witten, D., Hastie,T., Tibshirani,R. (2013). An Introduction to Statistical Learning with Applications in R, Springer.
Complementar
- Milovanović., I. (2013). Python Data Visualization Cookbook. 1st edition. PACKT Books.
- Berthold, M.R., Borgelt, C., Höppner, F., e Klawonn, F. Guide to Intelligent Data Analysis - How to Intelligently Make Sense of Real Data. 1st edition. Texts in Computer Science. Springer-Verlag London, 2010.
Método de Avaliação
- Frequência - 30 %
- Participação nas sessões teóricas e de laboratório - 10 %
- Projecto - 60 %