Titulo Estágio
Sistema de Self-Learning e Personalização de conversas com AI Agents
Áreas de especialidade
Sistemas Inteligentes
Engenharia de Software
Local do Estágio
Coimbra (office Taveiro)
Enquadramento
Os agentes conversacionais baseados em Large Language Models (LLM) tornaram-se rapidamente um elemento diferenciador nos serviços digitais de suporte ao cliente, venda assistida e automação de processos. No entanto, a sua qualidade e relevância dependem fortemente do alinhamento entre o modelo, o domínio de negócio e a forma como o conhecimento institucional evolui.
Os métodos tradicionais de actualização implicam ciclos de treino demorados, equipas especializadas e risco elevado de regressão de desempenho. Paralelamente, regulamentos de protecção de dados e requisitos de auditabilidade exigem rastreabilidade nas decisões algorítmicas e capacidade de rollback rápido.
A WIT, no âmbito da sua plataforma GenAI para comunicação inteligente, pretende aprofundar um learning loop contínuo que permita:
• Recolha estruturada de conversas reais (texto e voz transcrito);
• Revisão humana guiada, medindo exactidão factual, conformidade legal e adequação de tom;
• Fine-tuning rápido (LoRA) para incorporar exemplos de alta qualidade usando recursos computacionais contidos;
• Métricas objectivas de inteligibilidade/fluência e de latência fim-a-fim;
• Testes A/B de novas versões de persona/prompt, com rollback em caso de degradação.
Ao disponibilizar estas capacidades num pipeline semi-automatizado, permite-se uma evolução contínua dos agentes e criam-se vantagens competitiva num mercado onde a experiência conversacional é cada vez mais crítica para retenção de clientes.
Sobre a WIT:
A WIT tem 24 anos de experiência na área das telecomunicações e trabalha para o mercado global. A empresa já desenvolveu software para mais de 40 países e conta com os seguintes clientes: Grupo Vodafone, Deutsche Telekom, NTT DoCoMo, KDDI, Softbank, AT&T, Verizon, Safaricom, Vodacom, Unitel, entre outros. Na WIT somos groundbreakers e procuramos, todos os dias, desafiar o status quo, fazendo mais e diferente, sempre com o objectivo de sermos cada vez melhores. Descobre aqui se também tu podes ser um groundbreaker:
https://www.youtube.com/watch?v=Mt9sCqvJx9U
Objetivo
O estágio visa efectuar uma análise exaustiva do estado-da-arte em ciclos de melhoria contínua de Large Language Models, abrangendo técnicas como RLHF, Direct Preference Optimization, RAG-feedback loop e, em particular, métodos de fine-tuning leve baseados em LoRA/QLoRA.
A partir dessa análise, será elaborada a arquitectura de um sistema modular que integre uma interface web de revisão humana, um pipeline automatizado de selecção de dados e fine-tuning, um serviço de métricas de desempenho (inteligibilidade, factualidade e latência) e o respectivo conector para implantação controlada na plataforma GenAI da WIT.
Com esta base arquitectural definida, o estagiário passará à implementação de protótipos funcionais de cada módulo, garantindo a sua integração com agentes já existentes na plataforma. Pretende-se que o sistema suporte todo o ciclo de vida dos dados — da recolha e anonimização de conversas reais, passando pela classificação humana guiada, até à orquestração de jobs de treino LoRA e ao versionamento de pesos e templates de persona. Paralelamente, serão definidas e aplicadas métricas objectivas que permitam quantificar ganhos de qualidade e de latência entre versões sucessivas do agente, suportando testes A/B e rollback seguro.
Por fim, será produzida documentação técnica completa — incluindo guias de utilizador, exemplos de optimização e instruções operacionais — que permita escalar a solução internamente e transferir conhecimento para equipas de engenharia e clientes.
Plano de Trabalhos - Semestre 1
Para o 1º semestre estão planeadas as seguintes tarefas:
• Levantamento do Estado da Arte: técnicas de fine-tuning leve (LoRA, QLoRA), data quality filtering e avaliação automática.
• Estudo de ferramentas open-source (e.g. Hugging Face PEFT, FastChat, LangSmith, TrueLens) e licenças aplicáveis.
• Caracterização dos datasets de conversas: formatos, privacidade, anonimização.
• Definição de métricas-chave (inteligibilidade, factualidade, latência, custo).
• Especificação da arquitectura e desenho de diagramas de componentes.
• Prototipagem da Interface Web: reprodutor de diálogo, formulários de rating, exportação de feedback.
• Configuração do ambiente de treino (serviço cloud com acesso a GPU) com pipelines de LoRA manual.
• Documentação intermédia: requisitos, decisões de design, backlog inicial.
Plano de Trabalhos - Semestre 2
Para o 2º semestre estão planeadas as seguintes tarefas:
• Automatização do ciclo LoRA, com criação de jobs ETL para filtrar e balancear dados e orquestração de fine-tuning.
• Testes funcionais e A/B: definição de cohorts, recolha estatística, análise de significância.
• Garantia de conformidade: processo para auditoria de dados, controlo de acesso, relatórios GDPR.
• Demonstração final: demo com comparação de versões pré-e-pós-treino, apresentação das melhorias.
• Documentação final: manual do utilizador, guias de optimização, instruções de operação e manutenção.
No final, o estagiário deverá entregar um protótipo funcional totalmente integrado e validado, demonstrando a viabilidade de um ciclo de melhoria contínua para agentes conversacionais, pronto para evolução em contexto real de produção.
Condições
O estágio será remunerado com uma bolsa mensal. Se o desempenho do aluno ao longo do mês for positivo, terá direito a receber a bolsa correspondente. O local de trabalho será no escritório da WIT Software em Taveiro, sendo o regime híbrido, com o número de dias presenciais a definir posteriormente.
O aluno terá ao seu dispor os equipamentos necessários para desempenhar as suas tarefas. Para além disso, o aluno terá ainda acesso às formações da WIT Academy e às actividades e eventos que decorrerem durante o seu estágio.
No final do estágio, será feita uma avaliação do estagiário e dos conhecimentos adquiridos. Se o resultado for positivo espera-se que o estagiário seja convidado para fazer parte da equipa de desenvolvimento.
Observações
O acompanhamento ao longo do estágio será feito não apenas pelo orientador, mas também por um tutor técnico que lhe dará todo o apoio necessário. O orientador define os requisitos do estágio, define as prioridades do backlog e acompanha os resultados parciais do projecto. O tutor garante o cumprimento das tarefas, promove as meetings e acompanha o aluno com mais regularidade.
Toda a documentação de projecto será preferencialmente em inglês.
Será usado SCRUM, como metodologia de desenvolvimento.
Orientador
Paulo Jorge Pereira de Sousa
paulo.sousa@wit-software.com 📩