Titulo Estágio
Extensão automática de uma ontologia lexical com recurso a outras fontes de conhecimento
Área Tecnológica
Inteligência Artificial
Local do Estágio
LIA 2 - DEI
Enquadramento
O Onto.PT é uma ontologia pública para a língua portuguesa, construída automaticamente a partir de dicionários e tesauros electrónicos para a mesma língua. É um recurso estruturado de forma semelhante à WordNet, ou seja é, constituído por: (i) synsets, que são grupos de palavras sinónima que representam conceitos (e.g. {carro, automóvel} ou {escrever, lavrar, redigir}); (ii) relações entre synsets, como hiperonímia (e.g. animal hiperónimo-de cão) ou parte-de (e.g. roda parte-de carro).
No entanto, ao contrário da WordNet, que também pode ser utilizada como um simples dicionário, o Onto.PT não tem definições nem frases exemplo para cada synset.
Se, por um lado, a construção manual destas frases se prevê demasiado trabalhosa, a obtenção das frases de forma automática e directa, por exemplo através de dicionários electrónicos, não é trivial, especialmente devido a ambiguidade que existe na língua. Por exemplo, a palavra banco tanto pode significar um assento como uma instituição financeira.
http://ontopt.dei.uc.pt
http://wordnet.princeton.edu/
Objetivo
O objectivo deste trabalho passa por tirar partido da estrutura do Onto.PT e, especialmente, de outras fontes de conhecimento públicas, de forma a completar o próprio Onto.PT.
Espera-se que sejam desenvolvidas ferramentas que consigam mapear os synsets do Onto.PT com definições em dicionários electrónicos, como o Wikcionário.PT ou, possivelmente, com artigos da Wikipédia.
Será depois interessante utilizar o mapeamento gerado para obter um conjunto frases exemplo para os synsets, que poderão ser úteis na sua compreensão. Essas frases podem vir do próprio Wikcionário, de ligações do Wikcionário à Wikipédia, ou de outros recursos disponibilizados na Web.
Plano de Trabalhos - Semestre 1
• Revisão bibliográfica
• Estudo do estado da arte relativamente a ontologias lexicais e extracção de informação
• Estudo da estrutura do Onto.PT
• Estudo de possíveis tecnologias de desenvolvimento
• Análise e especificação do protótipo
Plano de Trabalhos - Semestre 2
• Implementação do protótipo
• Testes e experimentação do protótipo
• Elaboração da dissertação
• Escrita de artigo científico
Condições
O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores.
O trabalho não será remunerado.
Orientador
Paulo Gomes, Hugo Oliveira
pgomes@dei.uc.pt 📩