Propostas de Estágio 2012/2013

DEI - FCTUC
Gerado a 2024-11-21 19:50:11 (Europe/Lisbon).
Voltar

Titulo Estágio

Extensão automática de uma ontologia lexical com recurso a outras fontes de conhecimento

Área Tecnológica

Inteligência Artificial

Local do Estágio

LIA 2 - DEI

Enquadramento

O Onto.PT é uma ontologia pública para a língua portuguesa, construída automaticamente a partir de dicionários e tesauros electrónicos para a mesma língua. É um recurso estruturado de forma semelhante à WordNet, ou seja é, constituído por: (i) synsets, que são grupos de palavras sinónima que representam conceitos (e.g. {carro, automóvel} ou {escrever, lavrar, redigir}); (ii) relações entre synsets, como hiperonímia (e.g. animal hiperónimo-de cão) ou parte-de (e.g. roda parte-de carro).

No entanto, ao contrário da WordNet, que também pode ser utilizada como um simples dicionário, o Onto.PT não tem definições nem frases exemplo para cada synset.

Se, por um lado, a construção manual destas frases se prevê demasiado trabalhosa, a obtenção das frases de forma automática e directa, por exemplo através de dicionários electrónicos, não é trivial, especialmente devido a ambiguidade que existe na língua. Por exemplo, a palavra banco tanto pode significar um assento como uma instituição financeira.

http://ontopt.dei.uc.pt
http://wordnet.princeton.edu/

Objetivo

O objectivo deste trabalho passa por tirar partido da estrutura do Onto.PT e, especialmente, de outras fontes de conhecimento públicas, de forma a completar o próprio Onto.PT.

Espera-se que sejam desenvolvidas ferramentas que consigam mapear os synsets do Onto.PT com definições em dicionários electrónicos, como o Wikcionário.PT ou, possivelmente, com artigos da Wikipédia.
Será depois interessante utilizar o mapeamento gerado para obter um conjunto frases exemplo para os synsets, que poderão ser úteis na sua compreensão. Essas frases podem vir do próprio Wikcionário, de ligações do Wikcionário à Wikipédia, ou de outros recursos disponibilizados na Web.

Plano de Trabalhos - Semestre 1

• Revisão bibliográfica
• Estudo do estado da arte relativamente a ontologias lexicais e extracção de informação
• Estudo da estrutura do Onto.PT
• Estudo de possíveis tecnologias de desenvolvimento
• Análise e especificação do protótipo

Plano de Trabalhos - Semestre 2

• Implementação do protótipo
• Testes e experimentação do protótipo
• Elaboração da dissertação
• Escrita de artigo científico

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores.
O trabalho não será remunerado.

Orientador

Paulo Gomes, Hugo Oliveira
pgomes@dei.uc.pt 📩