Titulo Estágio
Correção de viés em conjunto de dados
Áreas de especialidade
Sistemas Inteligentes
Engenharia de Software
Local do Estágio
Departamento de Engenharia Informática da Universidade de Coimbra
Enquadramento
Correção de viés em conjuntos de dados é o processo de corrigir ou mitigar distorções sistemáticas que podem estar presentes nos conjuntos de dados utilizados para criação de modelos de aprendizagem computacional. A ideia passa por transformar o conjunto de dados numa representação mais imparcial. O viés em um conjunto de dados ocorre quando há uma tendência sistemática que afeta a objetividade e a equidade dos dados. Essa distorção pode surgir devido a diferentes fatores, como a seleção inadequada da amostra, a falta de diversidade nos dados ou a introdução de preconceitos e estereótipos. Tipicamente a correção de viés em conjuntos de dados envolve a aplicação de técnicas e métodos estatísticos avançados para ajustar os dados, de forma a minimizar ou eliminar a influência de desvios indesejados. O objetivo final é obter um conjunto de dados mais justo, imparcial e confiável. A correção de viés em conjuntos de dados acaba por ser uma área de estudo em constante evolução, com o objetivo final de promover a qualidade e a integridade das análises e modelos que se façam com os dados.
No contexto desta dissertação pretende-se analisar as abordagens existentes e criar uma framework para correção automatica de viés em conjunto de dados tabulares. A dissertação está inserida no contexto do projeto NextGenAI - Centre For Responsible AI.
Objetivo
- Levantamento do estado da arte em correção de viés em conjunto de dados
- Criação de framework para a correção de viés em conjuntos de dados tabulares
Plano de Trabalhos - Semestre 1
T1 – Análise e levantamento de abordagens de correção de viés em conjunto de dados
T2 - Proposta de framework
T3 – Escrita de relatório intermédio.
Plano de Trabalhos - Semestre 2
T1 – Implementação de framework
T2 - Testes comparativos com abordagens do estado da arte.
T3 - Refinamento do sistema;
T3 – Escrita do relatório final.
Condições
Este trabalho será realizado nos grupos de investigação Cognitive and Media Systems (CMS/CISUC) e Evolutionary and Complex Systems (ECOS/CISUC). Serão disponibilizados recursos computacionais para a execução do plano de trabalhos.
Existe a possibilidade de o/a aluno/a receber uma bolsa de investigação para Licenciado de pelo menos 6 meses, renovável por igual período mediante acordo entre o orientador e o/a aluno/a. A bolsa seguirá as diretrizes das bolsas mensais da Fundação para a Ciência e Tecnologia (FCT).
Orientador
Penousal Machado / João Correia
machado@dei.uc.pt 📩