Propostas de Estágio 2011/2012

Gerado a 2025-08-21 22:19:10 (Europe/Lisbon).

Voltar

Titulo Estágio

Extração, Validação e Categorização de Conhecimento Relevante de Redes Sociais

Área Tecnológica

Inteligência Artificial

Local do Estágio

CMS-CISUC

Enquadramento

A atenção selectiva [1,2] é a capacidade exibida pelos humanos de selecionar partes relevantes da informação do ambiente. Este mecanismo é necessário, pois o ambiente é algo demasiado vasto impossibilitando a sua compreensão na totalidade. A definição de atenção seletiva aplica-se à nossa vida quotidiana, e o cenário urbano é um exemplo, no qual o crescimento de sistemas de informação ubíquos (telemóveis, Personal Digital Assistants (PDAs) e Personal Navigation Assistants (PNAs)) podem levar a problemas de sobrecarga de informação nos humanos. Isto acontece porque, há cada vez mais abundância de informação que esses dispositivos obtém através de comunidades online (e.g.: redes sociais, sistemas de transportes, sistemas de meteorologia) onde são partilhados links, notícias, eventos, comentários, etc.

Estas fontes têm-se tornado cada vez mais relevantes, daí advir a necessidade de criar mecanismos computacionais capazes de tirar proveito do conhecimento (e.g.: semântico [3] e geográfico [4]) partilhado pelos seus utilizadores. Um exemplo [5] é o Twitter, uma ferramenta de microblogging que tem vindo a crescer cada vez mais desde que foi lançado em Outubro de 2006.

No entanto, este tipo de comunidades também produzem muito "ruído" e falso conhecimento que necessita de ser avaliado e filtrado. Embora os humanos já tenham um mecanismo de atenção seletiva natural, este não evita que seja interrompido aquando surgem novas informações, por exemplo através de dispositivos móveis. Isto é crítico, visto que este tipo de interrupções são perigosas em determinados momentos, como por exemplo quando se está a conduzir e se é interrompido continuamente por esses aparelhos - e muitas das vezes com informação irrelevante para a tarefa que se está a executar no momento. Uma possível solução poderá passar por dotar esses dispositivos com um mecanismo de atenção seletiva artificial que selecione e comunique ao utilizador humano somente informação relevante [6]. Contudo, levanta-se a seguinte questão: Como fazer com que o dispositivo identifique a informação relevante de uma forma automática? A abordagem que se sugere passa por analisar, filtrar e categorizar o conhecimento partilhado e posteriormente entregar seletivamente a informação relevante ao utilizador, permitindo deste modo libertá-lo de interrupções desnecessárias.

Objetivo

Há dois objetivos principais nesta dissertação:
1)Desenvolver algoritmos para:
a)extrair eventos, de uma forma automática de redes sociais (e.g.: Twitter, Facebook, blogs, etc.), assim como as respetivas descrições;
b)validar de uma forma (semi)automática o conhecimento extraído;
c)caraterizar esses mesmos eventos em categorias.

2)Apresentar ao utilizador final o evento e a descrição associada ao mesmo, com base nas suas preferências (sentimento, motivação, localização, etc.).

O trabalho desenvolvido terá a possibilidade de ser integrado e testado num projeto real, de modo a avaliar o conhecimento extraído.

Plano de Trabalhos - Semestre 1

Fase 1 – Revisão bibliográfica e Estado da Arte
Fase 2 – Desenvolvimento de um protótipo simples para demonstração do conceito.
Fase 3 – Elaboração da proposta de dissertação.
Fase 4 – Desenvolvimento de soluções de acordo com o plano de investigação da proposta.

Plano de Trabalhos - Semestre 2

Fase 5 – Testes e experimentação.
Fase 6 – Escrita da Dissertação.
Fase 7 – Escrita de um artigo científico.

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC com recurso a meios computacionais adequados.
Durante todo o ano letivo haverá um acompanhamento regular por parte dos orientadores.
O trabalho não será remunerado.

Observações

Competências em programação, nomeadamente Java.
Será valorizado o aluno que tenha no seu currículo cadeiras como:
Inteligência Artificial;
Web Semântica;
Sistemas Ubíquos.

Bibliografia:

[1] D. Kahneman. (1973). “Attention and effort”. Englewood Cliffs, NJ: Prentice-Hall.

[2] R. D. Wright and L. M. Ward. (2008). “Orienting of Attention”. Oxford, UK: Oxford University Press.

[3] H.P. Costa, H. Gonçalo Oliveira, P. Gomes (2010). “Automatic Extraction and Validation of Lexical Ontologies from text”. MSc Thesis. CMS, CISUC, FCTUC.

[4] J. Oliveirinha (2010). “Semantics in Place and Time”. MSc Thesis. CMS, CISUC, FCTUC.

[5] Ana-Maria Popescu, Marco P., and Deepa P. (2011). “Extracting events and event descriptions from Twitter”. In Proc. 20th international conference companion on World Wide Web (WWW '11). ACM, New York, NY, USA, pag. 105-106.

[6] L. Macedo (2010) "A surprise-based Selective Attention Agent for Travel Information" in Proc. AW13 @ 9th International Conference on Autonomous Agents and Multiagent Systems, pp. 111-120.

Orientador

Luis Macedo; Hernani Costa (co-orientador)
macedo@dei.uc.pt 📩