Propsotas Atribuidas 2023/2024

DEI - FCTUC
Gerado a 2024-07-17 12:34:12 (Europe/Lisbon).
Voltar

Titulo Estágio

Data centric optimization in AutoML

Local do Estágio

Departamento de Engenharia Informática da Universidade de Coimbra

Enquadramento

As abordagens de Automatic Machine Learning (AutoML) procuram criar e optimizar pipelines de Machine learning a partir de um conjunto de dados, definição métricas a avaliar e restrições relacionadas com custo computacional ou tempo. Tipicamente o conjunto de dados é dado como entrada para a abordagem AutoML e a maior parte das frameworks de AutoML focam-se em automatizar a parte da escolha dos modelos e seus hiperparametros. Porém os dados são fundamentais para a maior parte das tarefas que envolvem aprendizagem computacional, desde questões de performance ligados à qualidade dos dados até questões de custo computacional.
Pretende-se explorar e integrar soluções que permitam uma abordagem AutoML tenha em conta a optimização do conjunto de dados de entrada, tornando-a uma abordagem AutoML centrada nos dados. Para isso, irão ser exploradas abordagens que optimizem os dados de forma integrada com numa abordagem AutoML como mais elemento a optimizar. Será feita a análise de impacto no algoritmo de AutoML e das soluções finais encontradas testando num conjunto de tarefas de benchmark para AutoML.

Objetivo

.Análise do estado da arte sobre AutoML e abordagens para optimização de conjunto de dados
.Análise de frameworks existentes de AutoML
.Proposta de abordagem de AutoML centrada nos dados
.Análise e comparação com soluções existentes de AutoML em benchmarks adequados a abordagens AutoML

Plano de Trabalhos - Semestre 1

T1 – Estado da arte sobre AutoML e abordagens para optimização de conjunto de dados
T2 - Escolha de framework a adaptar para os objetivos da tese
T3 - Proposta de abordagem AutoML centrada nos dados
T4 - Testes preliminares
T5 – Escrita do relatório intermédio

Plano de Trabalhos - Semestre 2

T1 - Reavaliação e ajuste da abordagem com base nos resultados dos Testes preliminares
T2 – Experimentação e validação em benchmarks de AutoML
T3 - Refinamento da framework
T4 – Escrita do relatório final

Condições

Este trabalho será realizado no grupo de investigação Evolutionary and Complex Systems (ECOS/CISUC). Recursos computacionais para a realização de experiências serão disponibilizados.

O/a aluno/a receberá uma bolsa de investigação para Licenciado de pelo menos 6 meses, renovável por igual período mediante acordo entre o orientador e o/a aluno/a. A bolsa seguirá as diretrizes das bolsas mensais da Fundação para a Ciência e Tecnologia (FCT).


Orientador

João Correia
jncor@dei.uc.pt 📩