Propostas atribuidas 2024/2025

DEI - FCTUC
Gerado a 2024-12-13 02:58:26 (Europe/Lisbon).
Voltar

Titulo Estágio

Monitorização do Contexto em Sistemas de Diálogo

Local do Estágio

DEI / CISUC

Enquadramento

Sistemas de diálogo, onde se incluem chatbots, têm como objetivo conversar com humanos. Esta capacidade implica normalmente compreender e responder a perguntas usando linguagem natural. No entanto, muitas das abordagens adoptadas no desenvolvimento destes sistemas têm ainda várias limitações.

Uma opção passa pela criação de agentes baseada em trabalho maioritariamente manual, nomeadamente no desenho de fluxos de diálogo, definição de entidades relevantes e das intenções possíveis, através de frases ou palavras-chave, entre outros.
Uma alternativa passa por, com base em diálogos reais entre humanos, aprender automaticamente a traduzir as interações do utilizador nas melhores respostas a dar.
Apesar de envolver muito menos trabalho, agentes baseados nesta segunda opção tendem a tornar-se repetitivos e a ser pouco coerentes, dificultando assim a sua aplicação a tarefas mais sérias, tais como apoio ao cliente.

Em qualquer caso, os agentes baseados nas abordagens anteriores terão dificuldade em lidar com o contexto. Por exemplo, não se lembrarão das perguntas feitas anteriormente e não conseguirão tirar partido de relações entre perguntas já feitas e respostas já dadas na mesma conversa (e.g., Encontrei o restaurante ideal. / Que comida serve? / Mexicana, e não é caro.).

Para que seja possível tirar partido do contexto, será necessário manter uma representação do estado do diálogo, que inclua um conjunto de aspetos relevantes e os seus valores em cada iteração (e.g., comida=mexicana, preço=médio).
Uma representação deste tipo pode ser um passo intermédio para a automatização das ações a desencadear, incluindo as respostas a dar, e pode também ser útil para a monitorização e optimização de conversas entre humanos, por exemplo, em call-centers.

Objetivo

O principal objetivo deste trabalho passa por investigar formas de extrair informação e manter uma representação do contexto em diálogos escritos.
Uma das tarefas a explorar é normalmente conhecida como Dialog State Tracking (DST), e consiste numa definição de "slots" relevantes para uma tarefa (e.g., comida, preço) e do respetivo preenchimento à medida que a conversa evolui.

Para inglês existem datasets de diálogo com a informação para DST anotada (e.g., MultiWOZ, CamRest). Esses datasets podem ser utilizados para estudar melhor a tarefa, e como referência para o treino e avaliação de modelos para DST.
Seria interessante a experimentação com métodos diferentes, tanto supervisionados como não-supervisionados, por exemplo, baseados em regras ou em modelos genéricos, já treinados para Extração de Informação ou Resposta Automática a Perguntas.

Dois objetivos secundários passam por tirar conclusões acerca das possibilidades de adaptar alguns dos métodos a:
(1) Diálogos de domínio aberto;
(2) Diálogos em português.
Devido à inexistência de diálogos em português com anotações para DST, será dada prioridade a métodos não-supervisionados, que podem ser aplicados a diálogos em redes sociais ou de apoio ao cliente, cedidos por uma operadora.

Plano de Trabalhos - Semestre 1

- Revisão da literatura (NLP, Diálogo, DST)
- Identificação e familiarização com ferramentas úteis ao trabalho
- Identificação dos dados usar no treino e validação dos métodos
- Experiências preliminares
- Elaboração da proposta de dissertação.

Plano de Trabalhos - Semestre 2

- Experimentação
- Avaliação na tarefa de DST
- Estudo de possíveis adaptações (domínio aberto, português)
- Elaboração da dissertação de mestrado.
- Escrita de artigo científico.

Condições

O local de trabalho será num laboratório do CISUC, no DEI, onde haverá um acompanhamento regular por parte dos orientadores.
O trabalho será integrado num projeto de investigação em co-promoção, no âmbito do qual o estudante se poderá candidatar a uma bolsa de investigação para licenciado, durante um período entre 6 a 12 meses, no valor de 875€ / mês.

Observações

Durante a fase de candidatura, dúvidas relacionadas com esta proposta, nomeadamente acerca dos objectivos e condições, devem ser esclarecidas com os orientadores, através de e-mail (hroliv@dei.uc.pt) ou de uma reunião, a marcar após um contacto por e-mail.

Orientador

Hugo Gonçalo Oliveira e Catarina Silva
hroliv@dei.uc.pt 📩