Propostas Submetidas

DEI - FCTUC
Gerado a 2025-07-17 13:37:45 (Europe/Lisbon).
Voltar

Titulo Estágio

Explicação Automática de Conceitos de Engenharia de Software com a LLM Amália

Áreas de especialidade

Sistemas Inteligentes

Local do Estágio

DEI

Enquadramento

A Engenharia de Software é uma disciplina complexa, composta por múltiplos conceitos abstratos, metodologias e práticas cujo ensino e aprendizagem requerem um elevado nível de clareza e contextualização. A crescente disponibilidade de modelos de linguagem de grande escala (LLMs) abre novas possibilidades para o apoio à explicação automática de conceitos técnicos, incluindo em contextos educacionais e profissionais.
No âmbito de um projeto nacional centrado no desenvolvimento e fine-tuning de uma LLM em português — a LLM Amália — surge a oportunidade de explorar a sua aplicação como ferramenta pedagógica e técnica no domínio da Engenharia de Software. No entanto, existem desafios significativos, desde limitações computacionais para fine-tuning extensivo até restrições legais relacionadas com o uso de fontes didáticas. Estes fatores tornam especialmente relevante a adoção de técnicas como RAG (Retrieval-Augmented Generation).
Este projeto propõe o desenvolvimento de uma abordagem técnica baseada na LLM Amália, focada na explicação automática e contextualizada de conceitos fundamentais de Engenharia de Software em português europeu, utilizando RAG como pilar técnico para suportar a geração controlada e justificável de conteúdo explicativo.

Objetivo

O principal objetivo é explorar e desenvolver técnicas para a explicação automática de conceitos de Engenharia de Software em português, utilizando a LLM Amália em combinação com mecanismos de recuperação de conhecimento (RAG). Os objetivos específicos são:
1. Definir um conjunto (corpus) representativo de conceitos de Engenharia de Software a serem explicados, com base em currículos académicos, conteúdos de cursos e documentação técnica pública.
2. Desenhar e implementar uma pipeline de explicação automática suportada pela LLM Amália, com recurso a RAG para integrar conteúdos de fontes válidas e autorizadas.
3. Avaliar a qualidade, clareza e utilidade das explicações geradas, com base em métricas objetivas (ex. coerência, completude) e subjetivas (ex. avaliação por especialistas).
4. Estudar abordagens leves de adaptação da LLM Amália ao domínio da Engenharia de Software, com especial atenção a métodos alternativos ao fine-tuning, como prompt engineering e few-shot learning.

Plano de Trabalhos - Semestre 1

Revisão da Literatura e Estado da Arte
Estudo aprofundado sobre modelos de linguagem (LLMs), técnicas de Retrieval-Augmented Generation (RAG), abordagens de explicação automática, prompt engineering e desafios no ensino de Engenharia de Software em português. Levantamento de ferramentas, benchmarks e boas práticas relevantes.
[13/10/2025 a 09/11/2025] Definição do Domínio e Recolha de Fontes Autorizadas
Identificação dos conceitos-chave de Engenharia de Software a incluir no sistema de explicação. Seleção e preparação de fontes públicas e autorizadas (e.g., documentação oficial, textos open access, normas, artigos técnicos) para uso na componente de recuperação do sistema RAG.
[10/11/2025 a 07/12/2025] Desenvolvimento do Protótipo Inicial com RAG
Implementação de uma pipeline funcional baseada em RAG com integração preliminar da LLM Amália. Desenvolvimento de scripts para indexação de conteúdos e geração de respostas explicativas orientadas a conceitos previamente definidos.
[08/12/2025 a --/01/2026] Redação da Proposta de Tese Completa
Elaboração do relatório intermédio, incluindo motivação, objetivos, enquadramento, plano de trabalhos, metodologia e primeiros resultados.

Plano de Trabalhos - Semestre 2

Otimização e Expansão da Pipeline de Explicação
Desenvolvimento da pipeline e mecanismos de recuperação semântica, reformulação de prompts, e integração de estratégias de few-shot learning. Introdução de testes com múltiplos estilos de explicação.
[02/03/2026 a 19/04/2026] Avaliação da Qualidade das Explicações Geradas
Definição e aplicação de métricas de avaliação objetiva (ex. precisão semântica, cobertura, clareza) e subjetiva (feedback de utilizadores finais: estudantes e docentes). Comparação com abordagens alternativas quando aplicável.
[20/04/2026 a 10/05/2026] Análise Crítica e Formulação de Recomendações
Discussão dos resultados obtidos, análise das limitações da abordagem e proposta de recomendações para a integração pedagógica da LLM Amália no contexto de ensino da Engenharia de Software. Identificação de oportunidades futuras de desenvolvimento.
[11/05/2026 a --/06/2026] Redação da Dissertação Final e Preparação da Defesa
Elaboração do documento final da dissertação, com descrição detalhada da metodologia, resultados, discussões e conclusões. Preparação da defesa e materiais complementares (ex. artigo científico, repositório público, anexos técnicos).

Condições

This work occurs within the context of the AMALIA (Automatic Multimodal Language Assistant with Artificial Intelligence)” project and depending on the evolution of the internship a studentship may be available to support the development of the work. The work is to be executed at the laboratories of the CISUC’s Software and Systems Engineering (SSE)

Orientador

Joao Campos
jrcampos@dei.uc.pt 📩