Propostas submetidas

DEI - FCTUC
Gerado a 2024-05-04 18:54:39 (Europe/Lisbon).
Voltar

Titulo Estágio

Chatbots com Memória

Áreas de especialidade

Sistemas Inteligentes

Local do Estágio

DEI / CISUC

Enquadramento

Há cada vez mais agentes conversacionais (chatbots) capazes de compreender e responder a perguntas em linguagem natural. No entanto, as várias abordagens em que o seu desenvolvimento se baseia têm ainda várias limitações.

Por exemplo, quanto mais texto for usado para treinar agentes end-to-end com base em técnicas de deep learning, mais próximo de um humano serão as respostas dadas. No entanto, as conversas podem facilmente tornar-se repetitivas, ser pouco coerentes e / ou triviais, dificultando assim a sua utilização na resolução de um problema ou tarefa em concreto.
Por outro lado, o desenvolvimento de um agente que ultrapasse os problemas anteriores requer uma grande quantidade de trabalho manual, nomeadamente para definir entidades relevantes, tarefas / perguntas a que o agente consegue responder, e as formas em que elas podem ser colocadas. Para além de consumir muitos recursos, é normal que este trabalho tenha de se fazer para cada novo domínio de aplicação em que se queira configurar o agente.
Um terceira alternativa, mais flexível, passa por criar uma base de conhecimento de com perguntas e respostas a partir da exploração de recursos existentes (e.g., listas de FAQs, legendas de filmes e outros diálogos) e basear o agente em técnicas de recuperação de informação e similaridade semântica a que ele pode recorrer para mapear as interações do utilizador com interações conhecidas.
Em qualquer caso, sem nenhum outro mecanismo, os agentes baseados nas técnicas anteriores terão dificuldade em lidar com o contexto. Por exemplo, não se lembrarão das perguntas feitas anteriormente e não conseguirão tirar partido de relações entre perguntas feitas e respostas dadas na mesma conversa~(e.g., Quando foi o jogo? Quem ganhou?).

Objetivo

Este trabalho tem como objetivo principal o desenvolvimento de agentes que possam considerar o contexto da conversa na procura pela melhor resposta às perguntas colocadas.
Será para isso necessário partir de uma arquitetura de agente conversacional e adaptá-la de forma a que os agentes nela baseados tenham algum tipo de memória de que consigam tirar partido.
A arquitetura desenvolvida deverá ainda ser testada em pelo menos dois domínios / cenários de aplicação.

Para garantir maior flexibilidade e evitar a necessidade de conhecimento ou treino específico, os agentes a desenvolver podem seguir as linhas de trabalho anterior no CISUC. Mais propriamente, a sua base de conhecimento pode ser criada a partir de listas de FAQs, idealmente já existentes. A essas, e para lhes atribuir um comportamento mais humano, poderão adicionar-se algumas perguntas (e respostas) mais genéricas ou até pessoas (i.e., "Estás bom?", "És um humano?").
Para mapear interações do utilizador com perguntas conhecidas (i.e., na base de conhecimento) devem ser aplicadas técnicas de similaridade semântica, por exemplo, baseadas em modelos linguagem pré-treinados (e.g., BERT), ou de recuperação de informação (i.e., indexação e ranking com base em TF-IDF ou BM25).

De forma a considerar o contexto, será necessário que a arquitetura proposta inclua algum tipo de "memória contextual", que possa ser mantida e usada no diálogo.
Aqui devem ser exploradas técnicas que permitam popular a memória com base no diálogo (por exemplo, com histórico de perguntas e / ou variáveis e valores), e ainda técnicas que permitam combinar a base de conhecimento do agente (i.e., as perguntas conhecidas) com o contexto, para assim conseguir identificar relações entre a pergunta feita e as perguntas anteriores. Por exemplo, em casos de incerteza, poderá fazer sentido dar mais do que uma resposta, mas é pouco provável que o utilizador faça duas vezes a mesma pergunta. A introdução destes mecanismos permitirá a realização de conversas menos repetitivas e, assim, mais úteis.

Plano de Trabalhos - Semestre 1

- Revisão da literatura: arquiteturas para o desenvolvimento de chatbots
- Familiarização com as ferramentas e dados a utilizar na experimentação
- Identificação de problemas relacionados com a falta de contexto
- Propostas de adaptação a uma arquitetura, com vista a inclusão de memória contextual
- Elaboração da proposta de dissertação.

Plano de Trabalhos - Semestre 2

- Implementação da memória e adaptações necessárias
- Experimentação em pelo menos dois cenários
- Avaliação das abordagens propostas, incluindo a comparação de agentes com e sem memória
- Elaboração da dissertação de mestrado.
- Escrita de artigo científico

Condições

O local de trabalho será num laboratório do CISUC, no DEI, onde haverá um acompanhamento regular por parte dos orientadores.
Este trabalho pode vir a ser integrado num projecto de investigação P2020 em co-promoção. Nesse caso, o estudante poderá candidatar-se a uma bolsa de investigação para licenciado durante um período entre 6 a 12 meses, no valor de 798€ / mês.

Observações

Durante a fase de candidatura, dúvidas relacionadas com esta proposta, nomeadamente acerca dos objectivos e condições, devem ser esclarecidas com os orientadores, através de e-mail (hroliv@dei.uc.pt) ou de uma reunião, a marcar após um contacto por e-mail.

Orientador

Hugo Oliveira
hroliv@dei.uc.pt 📩