Propostas de Estágio 2014/2015 - Plurianual

DEI - FCTUC
Gerado a 2024-04-26 21:56:18 (Europe/Lisbon).
Voltar

Titulo Estágio

Aumento da usabilidade de uma ontologia lexical criada automaticamente

Área Tecnológica

Inteligência Artificial

Local do Estágio

DEI - Laboratório de Inteligência Artificial

Enquadramento

Wordnets são ontologias sobre as palavras de uma língua, estruturadas em: (i) synsets, grupos de palavras sinónimas que representam conceitos (e.g. {carro, automóvel} ou {escrever, lavrar, redigir}); (ii) relações entre synsets, como hiperonímia (e.g. animal hiperónimo-de cão) ou parte-de (e.g. roda parte-de carro).

O Onto.PT é um recurso que vem sendo desenvolvido no CISUC e que se encontra estruturado como uma wordnet, mas que foi construído automaticamente para a língua portuguesa, a partir de dicionários e tesauros electrónicos. O Onto.PT é livre e encontra-se disponível num formato RDFs, uma linguagem utilizada para representar ontologias, utilizada normalmente na Web Semântica.

Objetivo

Esta dissertação tem dois objectivos principais, que visam melhorar a usabilidade do Onto.PT, através da (re-)organização do conhecimento nele representado. São eles:
1) Procura de alternativas para representar o conhecimento e disponibilizar o recurso
2) Re-organização automática de alguns tipos de relação

Relativamente ao primeiro objectivo, a representação actual do Onto.PT segue de perto a versão mais básica de um modelo RDF já utilizado para representar outros wordnets . No entanto, esta representação não se tem verificado suficientemente flexível e deverá ser alterada com vista a permitir, por exemplo: (i) a especificação de uma ordem das palavras dentro dos synsets (e.g. de acordo com a sua importância); (ii) a associação de definições a synsets. Não só será importante estudar alternativas para permitir estas adições, como seria também interessante desenvolver um API para consultar o recurso, nesta nova representação, de forma programática.

Já relativamente ao segundo objectivo, devido a ser criado de forma automática, as ligações no Onto.PT não são tão sistemáticas como seria desejado. Por exemplo, no que diz respeito a relações de hiperonímia, há synsets muito específicos ligados directamente a synsets mais genéricos (e.g. animal hiperónimo-de gazela) ao contrário de outros que atravessam vários níveis (e.g. animal hiperónimo-de mamífero hiperónimo-de cão hiperónimo-de dálmata). A ideia desta parte do trabalho seria estudar a possibilidade de definir regras para re-organizar alguns tipos de relação, e assim tornar o Onto.PT mais sistemático, tal como outras ontologias, aumentado também a sua usabilidade.

Plano de Trabalhos - Semestre 1

• Revisão bibliográfica
• Estudo da estrutura do Onto.PT e sua representação actual
• Estudo de modelos para representar ontologias
• Análise e especificação das alterações necessárias
• Escrita da Proposta de Tese

Plano de Trabalhos - Semestre 2

• Implementação das alterações e testes
• Definição de regras para re-organização do conhecimento
• Implementação das regras e testes
• Elaboração da dissertação
• Escrita de artigo científico

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores.

Orientador

Paulo Gomes, Hugo Oliveira
pgomes@dei.uc.pt 📩