Titulo Estágio
Sistema de Conversação baseado em Ontologias
Área Tecnológica
Inteligência Artificial
Local do Estágio
DEI - Laboratório de Inteligência Artificial
Enquadramento
A interacção com sistemas para obtenção de informação é uma constante hoje em dia, sendo habitual, por exemplo, em serviços financeiros, linhas áreas, ou indústrias de telecomunicações. Na maioria dos casos, esta interactividade limita-se à pesquisa em listas de perguntas e respostas frequentes, pesquisa de palavras-chave em documentos usando um motor de busca, ou à intermediação de um operador que responde às questões colocadas.
Contudo, uma maneira mais fácil e eficaz seria a interação directa com o sistema, se possível, usando linguagem natural. É neste contexto que surgem os sistemas de diálogo e especificamente esta proposta de tese.
Este trabalho tem como ponto de partida dois trabalhos de doutoramento que se encontram a ser desenvolvidos no laboratório Knowledge and Intelligent Systems do grupo CMS do CISUC, nomeadamente os projectos Onto.PT e RAPPORT.
O Onto.PT[1] tem como principal objectivo a criação de uma ontologia para a língua portuguesa, construída automaticamente a partir de vários recursos textuais disponíveis para a nossa língua. Este recurso é totalmente constituído por conceitos, descritos por palavras e por relações entre conceitos, como hiperonímia ou is-a (conceito é um subtipo de outro) ou part-of (conceito é parte de outro).
Já o RAPPORT (Resposta Automática a Perguntas para o Português) tem como principais objectivos a geração e resposta automática a perguntas, usando frases presentes em textos como eventuais respostas a perguntas geradas com base nessas mesmas frases.
Espera-se que combinando os recursos de geração de perguntas, resposta a perguntas e uma ontologia que represente relações entre vários conceitos presentes em diversos corpora, seja possível a concepção de um sistema de diálogo interactivo, esclarecendo questões colocadas pelo utilizador, e mesmo guiando-o na obtenção de conhecimento com a sugestão de novas questões relacionadas com a questão inicialmente colocada pelo utilizador.
Objetivo
Há dois objectivos principais nesta dissertação:
1) Criar um interface em linguagem natural para um sistema que sugira perguntas e dê respostas com base na estrutura do Onto.PT. Este sistema deverá comportar:
a) Geração de perguntas em linguagem natural;
b) Sugestão de perguntas que o utilizador pode fazer;
c) Navegação no “histórico” das perguntas realizadas e exploração das relações entre estas.
Exemplos:
Q1: Para que serve um carro?
Q2: O que é um carro?
d) Resposta automática às perguntas, com base nas relações do Onto.PT, recorrendo a inferência, se necessário.
Exemplos:
R1: Um carro serve para transportar.
R2: Um carro ou automóvel é um veículo que tem rodas e serve para transportar.
O sistema deverá permitir uma forma alternativa de interrogar a ontologia (usando linguagem natural) e permitir a comparação das respostas automáticas com as respostas de utilizadores, de forma a avaliar os conteúdos da ontologia.
2) Avaliar as vantagens da utilização de uma ontologia lexical na resposta automática a perguntas. Por exemplo, o sistema deverá permitir a substituição de termos pelos seus sinónimos ou hiperónimo, o que poderá aumentar a abrangência das respostas e também o número de perguntas que possam ser sugeridas ao utilizador.
Plano de Trabalhos - Semestre 1
• Revisão bibliográfica
• Estudo do estado da arte relativamente a geração de perguntas, resposta automática a perguntas e ontologias
• Estudo da estrutura do Onto.PT e de trabalhos realizados no âmbito do RAPPORT
• Estudo de possíveis tecnologias de desenvolvimento
• Análise e especificação do protótipo
• Escrita da Proposta de Tese
Plano de Trabalhos - Semestre 2
• Implementação e testes do protótipo
• Experimentação do protótipo
• Elaboração da dissertação
• Escrita de um artigo científico
Condições
O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores. O trabalho não será remunerado.
Este trabalho vai ser coorientado pelos mestres e alunos de Doutoramento:
Hugo Oliveira (hroliv@dei.uc.pt)
Ricardo Rodrigues (rmanuel@dei.uc.pt)
Observações
[1] Hugo Gonçalo Oliveira and Paulo Gomes. Onto.PT: Automatic Construction of a Lexical Ontology for Portuguese. In Proceedings of 5th European Starting AI Researcher Symposium (STAIRS 2010), IOS Press 2010.
Orientador
Paulo Gomes
pgomes@dei.uc.pt 📩