Total Propostas

DEI - FCTUC
Gerado a 2024-05-19 13:34:45 (Europe/Lisbon).
Voltar

Titulo Estágio

Visualização e interacção com redes de palavras

Local do Estágio

DEI/CISUC

Enquadramento

As redes de palavras têm inúmeras aplicações ao nível do processamento computacional da língua. Como forma de representar conhecimento acerca das palavras de uma língua, são normalmente utilizadas como dicionários por sistemas que lidam com a linguagem humana (e.g. pesquisa de documentos, chatbots). Estas redes são estruturadas em palavras ou grupos de palavras (nós) e relações entre palavras (ligações), tais como: 'cão é-um animal', 'roda parte-de carro', ou 'pá serve-para cavar'.

Há diversas redes de palavras, com diferentes características e dimensões, e para diferentes línguas. Muitas são disponibilizadas através de meros ficheiros de texto ou bases de dados, sem uma forma melhor de serem exploradas. Para outras, tais como a WordNet de Princeton (http://wordnetweb.princeton.edu/perl/webwn), existem interfaces de pesquisa através da web, fortemente baseados em texto e sem tirar partido de elementos visuais.

O Onto.PT (http://ontopt.dei.uc.pt/) foi um projeto desenvolvido no CISUC onde foram recolhidas várias relações entre palavras portuguesas e criada uma rede baseada em grupos de sinónimos.
Nos últimos anos trabalho relacionado tem-se desenvolvido com vista à exploração de diferentes recursos e criação de diferentes redes, com diferentes características, tais como o nível de confiança.

Objetivo

A Visualização de Informação tem como objectivo tirar partido de recursos gráficos para apresentar e facilitar a compreensão de dados.
Esta dissertação tem como principal objectivo a exploração de técnicas de Visualização de Informação para facilitar a consulta e interacção com redes de palavras portuguesas, criadas no âmbito de projectos de investigação do grupo CMS do CISUC, nomeadamente no Onto.PT e projetos relacionados, como CONTO.PT.

Para algumas das redes mais recentes não existe sequer uma interface gráfica, o que limita bastante a exploração de toda a informação que contêm por parte daqueles interessados na sua utilização para os mais variados projetos.
Assim, o objectivo passará também pelo desenvolvimento de uma aplicação web de pesquisa, enriquecida por um conjunto de visualizações, a integrar no site do projeto Onto.PT.

Uma primeira fase do trabalho consistirá na aplicação de modelos de visualização conhecidos às redes alvo. Para além das palavras e suas ligações, as visualizações deverão faciitar a identificação de palavras ou relações com diferentes características (e.g., tipo ou confiança associada), e ainda permitir uma forma amigável de navegar pela rede.

Numa segunda fase, serão estudadas adaptações de alguns parâmetros dos modelos escolhidos, com vista a melhorar a experiência de interacção com a redes alvo.

Finalmente, numa fase mais avançada, poderão explorar-se formas alternativas e mais criativas de visualizar redes de palavras, cujas vantagens e desvantagens deverão ser analisadas.

Plano de Trabalhos - Semestre 1

- Revisão bibliográfica
- Familiarização com redes de palavras alvo
- Análise de interfaces gráficas disponíveis para este tipo de recurso
- Identificação de técnicas de visualização de informação aplicáveis a redes de palavras
- Primeiras experiências ao nível da aplicação de modelos conhecidos à visualização das redes alvo
- Elaboração da proposta de tese

Plano de Trabalhos - Semestre 2

- Adaptação dos modelos seleccionados com vista a melhorar aspectos técnicos e estéticos
- Desenvolvimento da aplicação web
- Exploração de formas alternativas para visualizar redes de palavras
- Experimentação e análise
- Escrita da dissertação

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores.

Observações

Durante a fase de candidatura, dúvidas relacionadas com esta proposta, nomeadamente acerca dos objectivos e condições, devem ser esclarecidas com o orientador, através de e-mail (hroliv@dei.uc.pt) ou de uma reunião presencial, a marcar após um contacto por e-mail.

Orientador

Hugo Gonçalo Oliveira e Evgheni Polisciuc
hroliv@dei.uc.pt 📩