Propostas atribuídas ano letico 2025/2026

DEI - FCTUC
Gerado a 2025-08-31 19:11:32 (Europe/Lisbon).
Voltar

Titulo Estágio

Sistema de Análise de Sentimentos em Áudio

Áreas de especialidade

Sistemas Inteligentes

Engenharia de Software

Local do Estágio

Coimbra (office Taveiro)

Enquadramento

A evolução acelerada das tecnologias de inteligência artificial e processamento de áudio tem vindo a transformar profundamente o setor das telecomunicações, criando novas oportunidades para a análise avançada de informação a partir de áudio. Em particular, a análise de sentimentos em áudio emerge como uma ferramenta inovadora e estratégica, permitindo às organizações captar e interpretar o estado emocional dos utilizadores em tempo real. Esta capacidade é especialmente relevante em ambientes ruidosos, como espaços públicos, domésticos ou centros de atendimento, onde a fiabilidade da deteção de emoções pode ser um fator diferenciador na qualidade do serviço prestado.

No contexto atual, a compreensão automática das emoções expressas na voz humana assume um papel fundamental na personalização da experiência do cliente, na monitorização da satisfação e na otimização de processos de suporte, sendo cada vez mais valorizada por operadores globais de telecomunicações. A integração de sistemas de análise emocional robustos permite não só antecipar necessidades e resolver problemas de forma proativa, mas também reforçar a reputação da marca e criar relações mais próximas e empáticas com os utilizadores.

O desenvolvimento de soluções eficazes para análise de sentimentos em áudio em ambientes ruidosos implica superar desafios técnicos significativos, nomeadamente a separação da voz do ruído de fundo, a extração fiável de características acústicas e a classificação precisa das emoções, mesmo com sinais degradados. A utilização de técnicas avançadas de deep learning, aliada ao transfer learning com modelos pré-treinados de última geração (como Wav2Vec 2.0 ou HuBERT), representa o estado da arte nesta área, permitindo acelerar o desenvolvimento e garantir elevados níveis de desempenho mesmo com conjuntos de dados limitados. A validação rigorosa do sistema, recorrendo a métricas reconhecidas (accuracy, F1-score, confusion matrix), é essencial para assegurar a robustez e fiabilidade da solução.

Este estágio propõe-se responder a estes desafios, promovendo a investigação e implementação de soluções inovadoras que potenciem a integração de inteligência artificial no ecossistema das telecomunicações. Será proporcionado ao estagiário uma oportunidade única para participar num projeto de vanguarda, adquirir competências técnicas avançadas e contribuir para a criação de soluções disruptivas com impacto real no setor.

Sobre a WIT:
A WIT tem 24 anos de experiência na área das telecomunicações e trabalha para o mercado global. A empresa já desenvolveu software para mais de 40 países e conta com os seguintes clientes: Grupo Vodafone, Deutsche Telekom, NTT DoCoMo, KDDI, Softbank, AT&T, Verizon, Safaricom, Vodacom, Unitel, entre outros. Na WIT somos groundbreakers e procuramos, todos os dias, desafiar o status quo, fazendo mais e diferente, sempre com o objectivo de sermos cada vez melhores. Descobre aqui se também tu podes ser um groundbreaker:
https://www.youtube.com/watch?v=Mt9sCqvJx9U

Objetivo

• Desenvolver um sistema de análise de sentimentos em áudio, robusto a ambientes ruidosos, capaz de detetar e classificar emoções na voz humana.
• Implementar técnicas avançadas de redução de ruído, recorrendo a modelos de deep learning open source, para isolar a voz do ruído ambiente e garantir a qualidade do sinal de entrada.
• Extrair características acústicas relevantes (MFCCs, pitch, energia, etc.) utilizando bibliotecas especializadas, de modo a gerar representações adequadas para análise emocional.
• Aplicar transfer learning com modelos pré-treinados (ex: Wav2Vec 2.0, HuBERT) para reconhecimento de emoções, realizando fine-tuning para adaptação ao contexto específico do projeto.
• Validar e avaliar sistematicamente o sistema, utilizando dados reais e simulados com diferentes níveis de ruído, recorrendo a métricas reconhecidas na área (accuracy, F1-score, confusion matrix).
• Documentar o processo de desenvolvimento, resultados, limitações e perspetivas de evolução futura, culminando num protótipo funcional e num relatório técnico detalhado.

Plano de Trabalhos - Semestre 1

• Revisão Bibliográfica e Estado da Arte: 40 horas
Levantamento das principais técnicas de redução de ruído e reconhecimento de emoções em áudio, com foco em abordagens de deep learning e transfer learning.
• Definição de Requisitos e Arquitetura do Sistema: 32 horas
Especificação dos requisitos funcionais e não funcionais, desenho da arquitetura geral do sistema e definição das interfaces entre módulos.
• Seleção e Experimentação de Técnicas de Redução de Ruído: 48 horas
Avaliação de diferentes algoritmos (subtração espectral, filtro de Wiener, redes neuronais profundas) em ambientes simulados, com análise comparativa de desempenho.
• Implementação do Módulo de Pré-processamento: 48 horas
Desenvolvimento do pipeline de normalização, segmentação e atenuação de ruído, integrando os métodos selecionados.
• Extração de Características Acústicas: 40 horas
Integração de bibliotecas para extração de MFCCs, pitch, energia e outras features relevantes, preparando os dados para a fase de classificação emocional.
• Recolha e Preparação de Dados: 48 horas
Compilação de datasets de áudio com diferentes níveis de ruído, incluindo gravações reais e bases de dados públicas, e preparação dos dados para treino e validação.

Estas estimativas são ajustáveis conforme o ritmo de progresso do estágio e eventuais necessidades do projeto.

Plano de Trabalhos - Semestre 2

• Implementação do Módulo de Classificação Emocional: 120 horas
Aplicação de modelos pré-treinados (Wav2Vec 2.0, HuBERT, etc.) e realização de fine-tuning com os dados preparados, otimizando para ambientes ruidosos.
• Integração dos Módulos e Desenvolvimento do Protótipo: 120 horas
Unificação dos componentes de pré-processamento, extração de características e classificação num sistema funcional.
• Validação e Avaliação Experimental: 160 horas
Realização de testes sistemáticos com dados reais e simulados, medindo desempenho com métricas como accuracy, F1-score e análise de confusion matrix, para diferentes cenários de ruído.
• Otimização: 80 horas
Ajuste de parâmetros, análise de limitações e implementação de melhorias incrementais com base nos resultados dos testes.
• Documentação e Relatório Técnico: 120 horas
Elaboração de documentação técnica detalhada, incluindo descrição da arquitetura, métodos implementados, resultados experimentais, limitações e sugestões para evolução futura.
• Preparação para Defesa: 120 horas
Estruturação do relatório final e preparação da apresentação para defesa do estágio.

Estas estimativas são ajustáveis conforme o ritmo de progresso do estágio e eventuais necessidades do projeto.

Condições

O estágio será remunerado com uma bolsa mensal. Se o desempenho do aluno ao longo do mês for positivo, terá direito a receber a bolsa correspondente. O local de trabalho será no escritório da WIT Software em Taveiro, sendo o regime híbrido, com o número de dias presenciais a definir posteriormente.

O aluno terá ao seu dispor os equipamentos necessários para desempenhar as suas tarefas. Para além disso, o aluno terá ainda acesso às formações da WIT Academy e às actividades e eventos que decorrerem durante o seu estágio.

No final do estágio, será feita uma avaliação do estagiário e dos conhecimentos adquiridos. Se o resultado for positivo espera-se que o estagiário seja convidado para fazer parte da equipa de desenvolvimento.

Observações

O acompanhamento ao longo do estágio será feito não apenas pelo orientador, mas também por um tutor técnico que lhe dará todo o apoio necessário. O orientador define os requisitos do estágio, define as prioridades do backlog e acompanha os resultados parciais do projecto. O tutor garante o cumprimento das tarefas, promove as meetings e acompanha o aluno com mais regularidade.
Toda a documentação de projecto será escrita em inglês.
Será usado SCRUM, como metodologia de desenvolvimento.

Orientador

Nuno Emanuel Figueiredo de Carvalho
nuno.carvalho@wit-software.com 📩