Titulo Estágio
Extração Automática de Fluxos de Diálogo
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
DEI / CISUC
Enquadramento
É cada vez mais comum recorrer a técnicas de Inteligência Artificial e, especificamente, Processamento de Linguagem Natural (PLN) no atendimento remoto de clientes. No caso dos chatbots, o atendimento pode nem precisar da intervenção de um agente humano. Mas também é possível tirar partido de ferramentas inteligentes para assistir agentes humanos, com vista a tornar as conversas mais eficientes, sem perder a naturalidade.
Entre essas ferramentas incluem-se sistemas de orientação ou de recomendação. Com base na monitorização da conversa e em conhecimento aprendido a partir de conversas anteriores, estes sistemas podem prever interações futuras e guiar o assistente humano, quer na obtenção de melhores respostas, quer na formulação ou sugestão de perguntas a realizar, tendo também como objetivo maximizar a satisfação do cliente.
Ainda que o principal objetivo deste trabalho seja desenvolver técnicas para apoio a assistentes humanos, muitas delas poderão também contribuir para o desenvolvimento de agentes artificiais (chatbots) cada vez mais inteligentes.
Objetivo
Este trabalho tem como objetivo explorar abordagens para analisar e estruturar diálogos, e assim chegar a representações que possam ser úteis a sistemas de orientação do assistente humano.
O trabalho deverá envolver o levantamento e exploração de abordagens para tarefas relacionadas, tais como:
- Segmentação de diálogos em partes coerentes (atos);
- Descoberta de segmentos ou atos comuns a diferentes diálogos (e.g., pergunta, resposta, opinião, ou outros mais específicos e úteis apenas em determinados domínios);
- Classificação automática de atos de diálogo, de acordo com uma lista pré-definida.
- Identificação de sequências de atos comuns a um conjunto de diálogos (fluxos).
O ponto de partida serão conjuntos de diálogos transcritos e disponíveis na forma de texto. Para desenvolvimento, será considerada a utilização de coleções disponíveis para fins de investigação e já com algumas anotações (e.g., MultiWOZ, DailyDialog) ou diálogos extraídos a partir de fóruns na Web ou redes sociais. Os modelos resultantes deverão também ser experimentados em diálogos fornecidos pela Talkdesk, empresa parceira.
Para segmentação, deverão ser consideradas tanto técnicas de aprendizagem não supervisionada como supervisionada.
A primeira, recorrerá a técnicas de clustering e terá a vantagem de se adaptar a diálogos com diferentes caraterísticas e em diferentes domínios ou línguas. A principal desvantagem estará na interpretação das descobertas, que poderão ser demasiado genéricas para terem utilidade em domínios concretos (e.g., saúde, agência de viagens).
Uma abordagem supervisionada será baseada nos diálogos já anotados. A utilidade destas anotações para o problema terá de ser avaliada e, se necessário, será considerada a anotação manual de alguns dados adicionais, a usar como referência.
Em qualquer caso, deverá ser considerado um pré-processamento de dados, com recurso a ferramentas e recursos de PLN. Esta fase será importante para a abstração de características associadas ao assunto, e consideração daquelas efetivamente úteis à classificação dos atos de diálogo.
Finalmente, os fluxos deverão emergir da análise de padrões comuns num conjunto de diálogos automaticamente anotados.
Plano de Trabalhos - Semestre 1
- Revisão da literatura: PLN, Análise e Modelação de Diálogo
- Familiarização com formas de segmentar e anotar diálogo
- Identificação de dados a utilizar
- Identificação e familiarização com ferramentas a utilizar
- Experiências iniciais (e.g., descoberta de atos de diálogo)
- Elaboração da proposta de dissertação.
Plano de Trabalhos - Semestre 2
- Classificação automática de atos de diálogo
- Descoberta de fluxos de diálogo
- Avaliação de soluções
- Elaboração da dissertação de mestrado.
- Escrita de artigo científico.
Condições
O local de trabalho será num laboratório do CISUC, no DEI, onde haverá um acompanhamento regular por parte do orientador.
O trabalho estará integrado num projeto de investigação em co-promoção que tem como parceira da Universidade de Coimbra a empresa Talkdesk. Neste âmbito, o estudante poderá candidatar-se a uma bolsa de investigação para licenciado, durante um período entre 6 a 12 meses, no valor de 835€ / mês.
Observações
Durante a fase de candidatura, dúvidas relacionadas com esta proposta, nomeadamente acerca dos objectivos e condições, devem ser esclarecidas com os orientadores, através de e-mail (hroliv@dei.uc.pt) ou de uma reunião, a marcar após um contacto por e-mail.
Orientador
Hugo Gonçalo Oliveira e Catarina Silva
hroliv@dei.uc.pt 📩