Laboratório de Ciência de Dados

Código

01060999

Créditos ECTS

6

Objetivos

1. Conhecer principais conceitos e metodologias em Ciência de Dados.
2. Saber explorar dados e construir visualizações gráficas.
3. Conhecer e aprender a aplicar métodos simples de aprendizagem estatística.
4. Criar e utilizar modelos de árvores de decisão e bayesianos.
5. Métodos de avaliação de modelos supervisionados.
6. Adquirir aptidões na utilização do R e do Python em aplicações de Ciência de Dados.

Programa

1. Introdução aos Conceitos e metodologias de Ciência de Dados
2. Utilização de ambientes de programação em R e Python.
3. Identificação de fontes de dados, exploração, pré-processamento e visualização de dados.
4. Introdução à aprendizagem estatística supervisionada.
5. Árvores de decisão para regressão e classificação.
6. Método Naive Bayes para classificação.
7. Métodos de avaliação com duas amostras e validação cruzada.

Métodos de Ensino

Nas sessões teóricas é utilizado o método expositivo e demonstrativo, com o recurso a ajudas visuais e a exemplos. Nas sessões de laboratório, os alunos desenvolvem projetos com base em guiões e com acompanhamento do docente, permitindo que trabalhem de forma autónoma, mas supervisionada. Todos os materiais de apoio são disponibilizados no Moodle, sendo esta ferramenta igualmente usada para entrega e discussão dos projetos.

Bibliografia

Essencial

- McKinney, W. (2017). Python for Data Analysis (2.a ed.). O’Reilly Media.

- Keen, K.J.. (2018). Graphics for Statistics and Data Analysis with R (2.a ed.). CRC Press.

- James, G, Witten, D., Hastie,T., Tibshirani,R. (2013). An Introduction to Statistical Learning with Applications in R, Springer.

Complementar

- Milovanović., I. (2013). Python Data Visualization Cookbook. 1st edition. PACKT Books.

- Berthold, M.R., Borgelt, C., Höppner, F., e Klawonn, F. Guide to Intelligent Data Analysis - How to Intelligently Make Sense of Real Data. 1st edition. Texts in Computer Science. Springer-Verlag London, 2010.

Método de Avaliação

  • Frequência - 30 %
  • Participação nas sessões teóricas e de laboratório - 10 %
  • Projecto - 60 %