Titulo Estágio
NLP e ML para a identificação de momentos chave em sessões de terapia
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
DEI-FCTUC
Enquadramento
De forma a melhor identificar progressos ou recuos no tratamento de problemas do foro psicológico, é comum gravar sessões de terapia, normalmente conversas entre um terapeuta e um paciente, permitindo assim uma análise cuidada após a sessão.
Esta análise é um processo moroso, tanto ao nível da transcrição, como ao nível da análise do seu conteúdo. Ela pode incluir a identificação de momentos de inovação a vários níveis, nomeadamente: 1) distância relativamente a um problema; 2) mudança; 3) integração de mudança e expansão.
Objetivo
Esta dissertação tem como objectivo de agilizar a identificação de momentos de inovação em sessões de terapia.
Primeiro, para auxiliar na transcrição, pretende-se recorrer a ferramentas de text-to-speech.
Contudo, o foco do trabalho será a exploração de modelos que permitam a identificar momentos de inovação em passagens no discurso, com base no seu conteúdo (e.g. palavras-chave, expressões, hesitações, ...).
Para tal, deverá tirar-se partido de ferramentas de processamento de linguagem natural (PLN) e, com elas, extrair do texto características que possam ser úteis à classificação.
O desenvolvimento dos modelos deve ser feito de uma forma incremental, que permita avaliar o impacto das características ou técnicas exploradas.
Numa fase inicial, a classificação poderá basear-se apenas num conjunto de regras. No entanto, as abordagens do estado da arte que têm revelado mais sucesso na classificação de texto baseiam-se em técnicas de aprendizagem computacional supervisionada (Supervised Machine Learning). Ou seja, os modelos são o resultado da aplicação de um algoritmo de aprendizagem sobre um as características extraídas de um conjunto de textos já transcritos e classificados por especialistas. No caso específico deste trabalho, existe já um conjunto de sessões transcritas e anotadas por terapeutas.
Os algoritmos mais populares para classificação automática estão incluídos em plataformas como o Weka (Java) ou o scikit-learn (Python), que visam precisamente facilitar a experimentação de diferentes algoritmos e parâmetros.
Plano de Trabalhos - Semestre 1
- Levantamento do estado da arte (processamento de linguagem natural e classificação automática de texto)
- Familiarização com os dados e identificação de características
- Primeiras experiências baseadas em regras
- Elaboração da proposta de dissertação
Plano de Trabalhos - Semestre 2
- Exploração de abordagens basedas em aprendizagem computacional
- Experimentação e avaliação
- Elaboração da dissertação
- Escrita de artigo científico
Condições
O local de trabalho será o laboratório de investigação do grupo CMS do CISUC, ainda que o trabalho seja desenvolvido em colaboração com o Centro de Investigação em Psicologia (CIPsi) da Universidade do Minho.
Há a possibilidade de este trabalho vir a ser remunerado através de uma bolsa de investigação para licenciado (745€/mês) com a duração de 6 meses.
Orientador
Hugo Gonçalo Oliveira e Penousal Machado
hroliv@dei.uc.pt 📩