Propostas com aluno atribuído

DEI - FCTUC
Gerado a 2024-04-29 00:42:00 (Europe/Lisbon).
Voltar

Titulo Estágio

Classificação de publicações em redes sociais com base na sua relevância

Áreas de especialidade

Sistemas Inteligentes

Local do Estágio

DEI-FCTUC

Enquadramento

O projecto REMINDS, estabelecido no âmbito da UT Austin-Portugal, tem como objectivo desenvolver sistemas que analisem informação a circular em redes sociais e identifiquem informação que seja potencialmente relevante para o público em geral. Muita informação nas redes sociais é privada, pessoal, pouco importante ou, simplesmente, irrelevante para o público. Mas é também nestas redes que se encontram grandes quantidades de informação importante e um grande número de opiniões, emitidas a um ritmo mais elevado que nos meios de comunicação tradicionais.

Serão seguidas essencialmente duas abordagens para a detecção de relevância: (i) teste de irrelevância; (ii) teste de relevância com base em características de texto jornalístico. Após a combinação destas abordagens, e de uma terceira com base em padrões de interacção, espera-se obter um modelo capaz de compreender melhor como as pessoas tomam decisões relativamente à relevância e que permita fazer previsões em larga escala.

Objetivo

Nesta dissertação pretende-se aplicar técnicas de processamento de linguagem natural à análise de publicações em redes sociais, para as quais já se desenvolveram os respetivos crawlers, de forma a classificá-las quanto à sua relevância, do ponto de vista jornalístico. Com base na análise do texto, serão aplicados filtros que possam ser combinados numa medida, primeiro, de irrelevância e, depois, de relevância. Os filtros a desenvolver pretendem responder sequencialmente a questões como:
- A informação é privada ou pessoal?
- Tem um âmbito reduzido ou alargado?
- Quais são os tópicos descritos?
- São tópicos originais?
- Qual a intensidade com são referidos?
Uma abordagem clássica passará por identificar, de forma automática, um conjunto de características, neste caso essencialmente linguísticas (palavras usadas e suas categorias gramaticais, construções específicas, ...), e aprender um classificador, capaz de responder às questões mencionadas, também de forma automática. Esta abordagem deverá ser o mais independente possível da língua, e deverá ser aplicada ao inglês e, idealmente, também ao português.

Este trabalho tem uma forte componente experimental. Embora possa decorrer de forma autónoma, um objectivo é que possa ser integrado e complementado com o trabalho feito por outros elementos da equipa do projecto, no sentido concretizar o seu objectivo global.

Plano de Trabalhos - Semestre 1

• Estudo do estado da arte relativamente a processamento de linguagem natural e classificação automática de texto
• Definição do conjunto de testes e medidas de avaliação
• Especificação de um protótipo
• Elaboração da proposta de dissertação

Plano de Trabalhos - Semestre 2

• Implementação do protótipo
• Avaliação do protótipo
• Elaboração da dissertação
• Escrita de artigo científico

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC, onde haverá um acompanhamento regular por parte do orientador.
Espera-se que haja reuniões pontuais com outros elementos da equipa do projecto, a realizar por videoconferência e/ou presencialmente.
Durante o desenvolvimento do trabalho, o aluno terá ao seu dispor um computador pessoal. À condição de uma entrevista prévia, o trabalho será remunerado, através de uma bolsa de licenciado (745 euros/mês), durante 12 meses, no âmbito do projecto REMINDS.

Orientador

Hugo Gonçalo Oliveira
hroliv@dei.uc.pt 📩