Introduction to Data Science
Código
01062634Créditos ECTS
3Objetivos
1. Reconhecer os principais conceitos e metodologias em Ciência de Dados.
2. Conhecer e aplicar métodos simples supervisionados e não supervisionados.
3. Criar e utilizar modelos de árvores de decisão e de redes neuronais artificiais.
4. Utilizar e interpretar medidas de avaliação de modelos supervisionados e não supervisionados.
5. Adquirir competências na utilização das bibliotecas sklearn e pandas do Python em aplicações de Ciência de Dados aplicadas a dados do oceano.
Programa
1. Sistemas de Apoio à Decisão (SAD). Tecnologias de Big Data e de Data MIning.
2. A metodologia de ciência de dados CRISP-DM, o conhecimento de domínio, exploração e pré-processamento de dados sobre o oceano.
3. Aprendizagem não supervisionada: análise de clusters e redução de dimensionalidade.
4. Aprendizagem supervisionados. Regressão e classificação. Naïfe Bayes, vizinhos mais próximos e modelos lineares.
5. Utilizar e interpretar medidas de avaliação de modelos supervisionados e não supervisionados.
6. Indução de árvores de classificação, de regressão e de modelos: o problema do sobreajustamento.
7. O Perceptrão Linear. Redes de perceptrão multicamada para regressão e classificação.
Métodos de Ensino
As aulas teórico-práticas incluem segmentos expositivos em que se apresentam os conceitos com recurso a exemplos e demonstrações que ilustram a utilização dos algoritmos e conceitos. Utilizam-se algumas metodologias dinâmicas baseadas em gamificação.
As partes mais práticas são preenchidas com a resolução conjunta de atividades de fichas de trabalho.
Bibliografia
- Aurélien Géron. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.ª ed.). O’Reilly Media.
- Jake VanderPlas. (2022). Python Data Science Handbook. O’Reilly Media (2.ª ed.).
- Andriy Burkov (2019) The Hundred-Page Machine Learning Book. Author Edition
- Oliver Theobald (2021) Machine Learning for Absolute Beginners: A Plain English Introduction. Scatterplot Press.
