Propostas atribuídas 2025/2026

DEI - FCTUC
Gerado a 2025-07-27 17:26:13 (Europe/Lisbon).
Voltar

Titulo Estágio

Desenvolvimento de Sistemas Inteligentes de Recomendação e Apoio à Decisão para Processos Participativos

Local do Estágio

Instituto Pedro Nunes, Coimbra (Laboratório de Informática e Sistemas)

Enquadramento

Os processos participativos, como os orçamentos participativos, são cada vez mais relevantes globalmente, evoluindo de simples votações para dinâmicas de cocriação e coparticipação. As atuais plataformas de suporte a estes processos necessitam de evoluir para acompanhar esta transformação, nomeadamente no que diz respeito ao apoio à cocriação, à cobertura de todo o ciclo de vida das propostas (desde a implementação à avaliação de impacto) e ao robustecimento dos mecanismos de votação e deteção de fraudes.

Neste contexto, o IPN está a colaborar no desenvolvimento de uma plataforma tecnológica inovadora. Esta plataforma visa responder aos desafios dos processos participativos de nova geração, incorporando mecanismos de interpretação semântica para sistemas de recomendação, processos de convergência de propostas e ferramentas de apoio à decisão para os gestores dos processos. O estagiário terá a oportunidade de trabalhar com tecnologias de Processamento de Linguagem Natural (PLN) e Inteligência Artificial (IA) para desenvolver e integrar estes sistemas. O projeto já se encontra em fase de desenvolvimento, com acesso a dados e infraestrutura para a criação e teste das soluções.

Objetivo

O objetivo principal deste estágio é investigar, desenvolver e integrar módulos de sistema de recomendação e de sistema de apoio à decisão na plataforma de processos participativos. O estagiário será responsável por:

- Investigar e desenvolver mecanismos de recomendação baseados em análise semântica e processamento de linguagem natural, com o intuito de facilitar a colaboração e a convergência de propostas.

- Desenvolver e treinar algoritmos de PLN em múltiplos idiomas (português, espanhol e inglês) para os mecanismos de recomendação.

- Investigar e conceber mecanismos de apoio à decisão, incluindo modelos computacionais de múltiplos objetivos e avaliação de risco.

- Desenvolver interfaces gráficas intuitivas e mecanismos de geração de outputs automatizados para o sistema de apoio à decisão, incluindo uma interface dedicada a explainable AI (XAI).

- Integrar os módulos desenvolvidos na plataforma existente e participar na sua validação.

Entre os recursos públicos mais relevantes contam-se os dumps Open-Data do Metadecidim [1], conjuntos de dados diários de propostas e comentários que espelham fluxos reais de participação; o NYC Participatory Budgeting Projects [2], registo estruturado de textos, custos e estado de execução de projectos; o corpus multilingue OSCAR [3] sob CC0 para adaptação de modelos em PT/ES/EN; o ParaCrawl v9 [4], bitexto massivo alinhado para reforçar tradução automática e embeddings cruzados; o EuroParl [5], debates parlamentares limpos e alinhados entre 21 línguas da UE; o benchmark STS17 da SemEval-2017 [6] para avaliar similaridade semântica multilingue; o MovieLens-20M [7], matriz de classificações canónica para prototipar recomendadores híbridos; o Statlog German Credit [8] para demonstrações explicáveis de avaliação de risco; o ERASER benchmark [9], colecção multi-tarefa com justificações humanas a nível de excerto; e o e-SNLI [10], camada de explicações em linguagem natural sobre pares de inferência textual.

Referências
[1] Metadecidim Open-Data dumps, Metadecidim portal. meta.decidim.org
[2] NYC Participatory Budgeting Projects, NYC Open Data. data.cityofnewyork.us
[3] OSCAR Corpus, OSCAR Project. oscar-project.org
[4] ParaCrawl v9, ParaCrawl project. paracrawl.eu
[5] EuroParl Parallel Corpus, Statmt.org. statmt.org
[6] SemEval-2017 Task 1 STS17, ACL Anthology. aclanthology.org
[7] MovieLens-20M dataset, GroupLens Research. grouplens.org
[8] Statlog German Credit Data, UCI Machine Learning Repository. archive.ics.uci.edu
[9] ERASER Benchmark, ERASER Project. eraserbenchmark.com
[10] e-SNLI Dataset, arXiv. arxiv.org

Plano de Trabalhos - Semestre 1

Durante o 1º semestre, o projeto será composto pelas seguintes fases de desenvolvimento:
• F1 – Análise do estado da arte e requisitos (25% do semestre): Aprofundamento do estudo sobre técnicas de NLP para tarefas de classificação/ categorização, extracção de informação e sobre sistemas de recomendação aplicados a processos participativos. Levantamento e detalhe dos requisitos para os módulos a desenvolver.
• F2 – Conceção e especificação (25% do semestre): Definição da arquitetura detalhada dos módulos de agregação e recomendação. Especificação dos algoritmos, modelos de dados e interfaces. Investigação e seleção das ferramentas e tecnologias a utilizar.
• F3 – Desenvolvimento inicial e prototipagem (40% do semestre): Início do desenvolvimento dos componentes nucleares dos módulos de agregação e de recomendação. Criação de protótipos iniciais para validação de conceitos e algoritmos. Preparação de datasets para treino e teste.
• F4 – Protótipo (10% do semestre): Elaboração e entrega do relatório intermédio.

Plano de Trabalhos - Semestre 2

Durante o 2º semestre, o projeto será composto pelas seguintes fases de desenvolvimento:
• F5 – Implementação e Desenvolvimento Avançado (60% do semestre): Desenvolvimento completo dos módulos de agregação e do sistema de recomendação, incluindo treino dos modelos de NLP e a implementação das interfaces gráficas.
• F6 – Integração e Testes (30% do semestre): Integração dos módulos desenvolvidos na plataforma principal. Realização de testes exaustivos para avaliar a funcionalidade, robustez, desempenho e precisão dos sistemas. Refinamento e otimização dos algoritmos e interfaces com base nos resultados dos testes.
• F7 – Documentação e Relatório Final (10% do semestre): Elaboração da documentação técnica detalhada dos módulos desenvolvidos e preparação do relatório final do estágio.

Condições

Este trabalho será integrado num projeto de investigação cofinanciado, sendo que o aluno poderá candidatar-se a uma bolsa de investigação para licenciado no âmbito deste projeto, nos termos da legislação aplicável e regulamentos do IPN. O valor da bolsa é de 1040,98€, em linha com a tabela de bolsas de investigação da FCT.

Observações

Áreas de especialidade:
Inteligência Artificial
Processamento de Linguagem Natural
Sistemas de Apoio à Decisão
Engenharia de Software

Orientador

João Coelho
jcoelho@ipn.pt 📩