Propostas com alunos identificados

DEI - FCTUC
Gerado a 2024-11-21 19:01:05 (Europe/Lisbon).
Voltar

Titulo Estágio

Estudo da combinação de contextos pouco balanceados e de dados em falta

Local do Estágio

DEI-CISUSC

Enquadramento

Em problemas de classificação, o desempenho de diferentes algoritmos pode variar de acordo com múltiplos fatores designados tipicamente na literatura como ‘difficulty factors’. Um dos problemas que tem sido alvo de estudo por vários investigadores é o problema dos dados pouco balanceados, onde na distribuição dos dados existe uma classe mais representa (classe maioritária) do que outra(s). Contudo, estudos recentes comprovam que este problema per se não influencia o desempenho dos classificadores, contudo, a sua combinação com outros degrada o desempenho dos classificadores. Apesar disso, a combinação do problema dos dados balanceados com dados em falta ainda não foi estudado.

Objetivo

Com este trabalho pretende-se endereçar estes dois problemas, dados pouco balanceados e dados em falta de forma combinatória, tentando ganhar conhecimento sobre a influência que cada um dos problemas tem entre si e que por consequência degrada o desempenho dos classificadores.

Plano de Trabalhos - Semestre 1

-Seleção de datasets em repositórios open source para realizar as experiências do estudo. Serão considerados o repositório UCI e o Kaggle
-Estudo e Implementação de diferentes mecanismos de dados em falta
-Definição e quantificação do problema de dados pouco balanceados
-Estudo da literatura sobre os estudos do problema de dados pouco balanceados e dados em falta
-Escrita do relatório intermédio

Plano de Trabalhos - Semestre 2

-Desenvolver Setup experimental para o problema combinatório dos dados pouco balanceados e dados em falta variando a distribuição dos pontos das diferentes classes, diferentes mecanismos de dados em falta a utilizar, percentagem de dados em falta entre outras
-Extrair conclusões
-Escrita de um artigo científico
-Escrita do relatório final de tese

Condições

-

Orientador

Pedro Manuel Henriques da Cunha Abreu
pha@dei.uc.pt 📩