Titulo Estágio
Deteção de viés em conjunto de dados
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
Departamento de Engenharia Informática da Universidade de Coimbra
Enquadramento
A detecção de viés em conjuntos de dados refere-se ao processo de identificar e avaliar o viés presente nos dados utilizados para treinar ou testar modelos de aprendizagem automática. O viés de dados ocorre quando as amostras do conjunto de dados não são representativas da população ou quando refletem desigualdades, preconceitos ou distorções presentes na sociedade. A detecção de viés é essencial para garantir que conjunto de dados para treino é justo. O processo envolve a análise de características sensíveis, como gênero, raça, origem étnica ou idade, para identificar correlações indesejadas entre essas características e classes do conjunto de dados. A detecção de viés pode ser realizada por meio de métricas estatísticas, técnicas de análise exploratória de dados ou algoritmos especializados que procuram revelar padrões discriminatórios. Ao identificar e compreender o viés nos conjuntos de dados, podemos tomar medidas para mitigá-lo e desenvolver conjunto de dados mais justos e imparciais.
No contexto desta dissertação pretende-se analisar as abordagens existentes e criar uma framework para deteção automática de viés em conjunto de dados tabulares. A dissertação está inserida no contexto do projeto NextGenAI - Centre For Responsible AI.
Objetivo
- Levantamento do estado da arte em deteção de viés em conjunto de dados
- Criação de framework para deteção de viés em conjuntos de dados tabulares
Plano de Trabalhos - Semestre 1
T1 – Análise e levantamento de abordagens de deteção de viés em conjunto de dados
T2 - Proposta de framework
T3 – Escrita de relatório intermédio.
Plano de Trabalhos - Semestre 2
T1 – Implementação de framework
T2 - Testes comparativos com abordagens do estado da arte.
T3 - Refinamento do sistema;
T3 – Escrita do relatório final.
Condições
Este trabalho será realizado nos grupos de investigação Cognitive and Media Systems (CMS/CISUC) e Evolutionary and Complex Systems (ECOS/CISUC). Serão disponibilizados recursos computacionais para a execução do plano de trabalhos.
Existe a possibilidade de o/a aluno/a receber uma bolsa de investigação para Licenciado de pelo menos 6 meses, renovável por igual período mediante acordo entre o orientador e o/a aluno/a. A bolsa seguirá as diretrizes das bolsas mensais da Fundação para a Ciência e Tecnologia (FCT).
Orientador
João Correia / Penousal Machado
jncor@dei.uc.pt 📩