Titulo Estágio
Controlo do Overfitting em Programação Genética
Área Tecnológica
Sistemas Evol. e Comp.
Local do Estágio
DEI-CISUC
Enquadramento
A Programação Genética (PG) é o mais novo paradigma dentro da área de investigação de inteligência artificial chamada computação evolucionária, e consiste na aprendizagem automática de programas de computador. Teoricamente, a PG pode resolver qualquer problema cujas soluções candidatas possam ser medidas e comparadas, sendo uma técnica prontamente aplicável a diferentes domínios. A PG devolve frequentemente resultados que não são apenas academicamente interessantes, mas também competitivos com o trabalho desenvolvido por humanos.
Por ser um paradigma recente, o uso prático de PG ainda coloca alguns desafios. Durante mais de 15 anos uma grande parte da investigação em PG foi dedicada a estudar o problema do bloat, que consiste numa proliferação excessiva de código redundante que aumenta o tamanho dos programas sem melhorar a sua aptidão. Típico da maioria dos algoritmos de aprendizagem supervisionada, outro problema enfrentado pela PG é o overfitting, que consiste na excessiva especialização das soluções propostas aos dados usados na aprendizagem, e consequente perda de capacidade de generalização a outros conjuntos de dados. Este problema nunca foi intensivamente estudado no âmbito específico da PG.
Resultados recentes mostraram que é finalmente possível efectuar uma aprendizagem isenta de bloat. No entanto, e ao contrário do que seria esperado, verificou-se que a eliminação do bloat não melhora a capacidade de generalização, observando-se mesmo alguma tendência para o aumento do overfitting. O overfitting é, assim, um dos poucos obstáculos que se colocam à eficaz utilização da PG na resolução de problemas do mundo real.
Objetivo
Pretende-se que o aluno estude as abordagens ao problema do overfitting actualmente usadas dentro e fora do contexto da PG, e desenvolva um ou mais métodos específicos para a PG que permitam reduzir ou mesmo eliminar o problema.
Plano de Trabalhos - Semestre 1
Revisão da literatura; identificação e implementação de algumas das abordagens mais utilizadas / utilizáveis em PG; desenvolvimento de novos métodos.
Plano de Trabalhos - Semestre 2
Implementação, teste e refinamento dos novos métodos, e respectiva comparação com as abordagens anteriores; validação em problemas do mundo real; elaboração da dissertação.
Condições
N/A.
Observações
O estágio terá como co-orientador do DEI o Professor Ernesto Costa
Orientador
Dra. Sara Silva
sara@dei.uc.pt 📩