Propostas de Estágio 2013/2014

DEI - FCTUC
Gerado a 2024-11-21 22:00:06 (Europe/Lisbon).
Voltar

Titulo Estágio

Desambiguação automática do sentido das palavras

Área Tecnológica

Inteligência Artificial

Local do Estágio

DEI - Laboratório de Inteligência Artificial

Enquadramento

Ao contrário das linguagens de programação, a linguagem natural pode ser ambígua. Isso significa que, por um lado, podem existir diferentes palavras para referir um conceito (e.g. carro e automóvel) e, por outro, a mesma palavra pode referir-se a diferentes conceitos (e.g. banco: instituição financeira ou assento). A desambiguação automática do sentido das palavras é uma tarefa que procura associar a ocorrência de palavras com o conceito que pretendem transmitir. Para tal, é habitual explorar tanto o contexto da palavra, como o conhecimento em recursos externos, tais como wordnets.

Wordnets são ontologias sobre as palavras de uma língua, estruturadas em: (i) synsets, grupos de palavras sinónimas que representam conceitos (e.g. {carro, automóvel} ou {escrever, lavrar, redigir}); (ii) relações entre synsets, como hiperonímia (e.g. animal hiperónimo-de cão) ou parte-de (e.g. roda parte-de carro).
O Onto.PT é um recurso que vem sendo desenvolvido no CISUC e que se encontra estruturado como uma wordnet, mas que foi construído automaticamente para a língua portuguesa, a partir de dicionários e tesauros electrónicos.

Objetivo

O principal objectivo desta dissertação é estudar a utilização do Onto.PT na desambiguação do sentidos de palavras em português. Para tal, será necessário implementar ou adaptar um conjunto de algoritmos já utilizados para realizar esta tarefa no inglês. Esses algoritmos exploram normalmente a estrutura da wordnet para encontrar semelhanças das palavras em contexto com os synsets, criando uma correspondência entre ambos. Por exemplo, na frase

Sentei-me num banco para descansar.

seria adequado associa banco ao synset {banco, assento}.

Para averiguar a qualidade tanto dos algoritmos implementados, como a adequação do Onto.PT para esta tarefa, será também necessário construir uma base de testes, de forma a avaliar a evolução dos resultados da desambiguação.

Acredita-se que este possa ser um trabalho com impacto significativo porque, apesar desta tarefa ser já realizada há muito anos para o inglês, é pioneira na nossa língua.

Plano de Trabalhos - Semestre 1

• Revisão bibliográfica
• Estudo do estado da arte relativamente a desambiguação do sentido das palavras
• Estudo da estrutura do Onto.PT
• Definição do conjunto de testes e medidas de avaliação
• Análise e especificação do protótipo
• Escrita da Proposta de Tese

Plano de Trabalhos - Semestre 2

• Implementação do protótipo
• Testes e experimentação do protótipo
• Elaboração da dissertação
• Escrita de artigo científico

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores.

Orientador

Paulo Gomes, Hugo Oliveira
pgomes@dei.uc.pt 📩