Introduction to Data Science
Código
01062634Créditos ECTS
3Objetivos
1. Reconhecer os principais conceitos e metodologias em Ciência de Dados.
2. Conhecer e aplicar métodos simples supervisionados e não supervisionados.
3. Criar e utilizar modelos de árvores de decisão e de redes neuronais artificiais.
4. Utilizar e interpretar medidas de avaliação de modelos supervisionados e não supervisionados.
5. Adquirir competências na utilização das bibliotecas sklearn e pandas do Python em aplicações de Ciência de Dados aplicadas a dados do oceano.
Programa
1. Sistemas de Apoio à Decisão (SAD). Tecnologias de Big Data e de Data MIning.
2. A metodologia de ciência de dados CRISP-DM, o conhecimento de domínio, exploração e pré-processamento de dados sobre o oceano.
3. Aprendizagem não supervisionada: análise de clusters e redução de dimensionalidade.
4. Aprendizagem supervisionados. Regressão e classificação. Naïfe Bayes, vizinhos mais próximos e modelos lineares.
5. Utilizar e interpretar medidas de avaliação de modelos supervisionados e não supervisionados.
6. Indução de árvores de classificação, de regressão e de modelos: o problema do sobreajustamento.
7. O Perceptrão Linear. Redes de perceptrão multicamada para regressão e classificação.
Métodos de Ensino
As aulas teórico-práticas incluem segmentos expositivos em que se apresentam os conceitos com recurso a exemplos e demonstrações que ilustram a utilização dos algoritmos e conceitos. Utilizam-se algumas metodologias dinâmicas baseadas em gamificação.
As partes mais práticas são preenchidas com a resolução conjunta de atividades de fichas de trabalho.
Avaliação por frequência - frequência (NF) e 1 projeto de grupo (PG) e atividades assíncronas semanais (AA).
A classificação final (CF) é calculada através de:
Se NF >=7 então CF=0.50*NF+0.35*PG + 0,15*AA senão CF=NF
Avaliação por exame: projeto (PG) e exame escrito (NE).
A classificação final (CF) é calculada de acordo com:
Se NE>=10 então CF= 0.6*NE+0.4*PG senão CF=NE
Bibliografia
- Aurélien Géron. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.ª ed.). O’Reilly Media.
- Jake VanderPlas. (2022). Python Data Science Handbook. O’Reilly Media (2.ª ed.).
- Andriy Burkov (2019) The Hundred-Page Machine Learning Book. Author Edition
- Oliver Theobald (2021) Machine Learning for Absolute Beginners: A Plain English Introduction. Scatterplot Press.
Método de Avaliação
De acordo com Métodos de Ensino - 100 %