Propostas Submetidas

DEI - FCTUC
Gerado a 2024-04-24 08:48:44 (Europe/Lisbon).
Voltar

Titulo Estágio

Extração automática de entidades de textos com indexação automática de termos

Áreas de especialidade

Sistemas Inteligentes

Local do Estágio

Trabalho remoto/DEI

Enquadramento

A Flainar (www.flainar.com) é uma app que ajuda viajantes apreciadores de história e literatura a vivenciarem novas experiências emocionais, que revelam de forma diferenciada a identidade cultural dos lugares, a partir de narrativas georreferenciadas – editadas por especialistas e entidades parceiras. Convertemos o conhecimento e as artes em dados que ajudam as pessoas a fruírem da cultura como instrumento terapêutico e da história como tutor de cidadania (civic engagement).

A aplicação móvel Flainar permite aos seus utilizadores inserir diversa informação, nomeadamente texto e imagens associada a locais. Os vários itens de informação estão relacionados através de uma teia de ligações (grafo de dados) que permite à aplicação oferecer ao utilizador informação relevante por associação. Alguma desta informação é proposta pelo utilizador, outra é parte do acervo da plataforma. Ambas seguem modelos de classificação previamente estabelecidos e os termos usados devem ser mantidos controlados. O modelo deve controlar a relação entre termos diferentes, nomeadamente entre aqueles que são sinónimos. Face à inserção de novos textos para a plataforma, esta deve fazer o parsing do conteúdo, fazer a extração de identidades e indexação automática de termos a partir do texto e apresentar o resultado ao utilizador para sua validação.

O acesso à informação utilizada pela aplicação móvel Flainar é feito através de uma API REST que disponibiliza os dados no formato JSON.

O desafio deste projecto consiste, primeiro, em criar um modelo dinâmico de controle de dados a partir dos termos associados aos conteúdos e ao modelo grafo (i.e., termos semanticamente similares e distâncias entre estes recorrendo ao apoio de dicionários online de termos), segundo, fazer a extração de identidades e indexação automática de termos a partir de textos para apoiar o processo de publicação na plataforma.

Objetivo

Este trabalho tem como principais objetivos propor:
- Uma abordagem para a extração de entidades relevantes em textos históricos e literários;
- Uma abordagem para a indexação automática dos textos anteriores com base nas entidades associadas;
- Um modelo que, com base num conjunto inicial de documentos / termos, permita recomendar entidades e outros documentos semanticamente relevantes;

Para além de uma exploração de abordagens para cada um dos objetivos, o trabalho deverá sempre considerar a relação entre esses objetivos e a sua integração na plataforma Flainar. Deverão ainda permitir uma fácil validação humana.

As várias explorações deverão tirar partido de um conjunto de textos já anotados e validados por humanos, que podem ser usados para indexação ou treino e avaliação de modelos de reconhecimento de entidades mencionadas e extração de conceitos.

Deverá ainda incluir a implementação das soluções propostas e avaliar a sua aplicação em ambiente de prototipagem.
Ainda que a integração seja maioritariamente da responsabilidade da equipa Flainar, a produção de toda a documentação necessária à integração da solução na plataforma também está no âmbito deste trabalho.

Plano de Trabalhos - Semestre 1

Semestre 1
● Levantamento do estado da arte e familiarização com o domínio do Processamento de Linguagem Natural e das tarefas úteis para o projeto.
● Estudo da estrutura da informação da Flainar
● Identificar ferramentas úteis ao desenvolvimento do projeto.
● Exploração de abordagens
● Proposta inicial das soluções a implementar.
● Elaboração da proposta de dissertação.

Plano de Trabalhos - Semestre 2

Semestre 2
● Implementação da proposta definida.
● Experimentação com dados da Flainar.
● Avaliação e documentação das soluções.
● Elaboração da dissertação de mestrado.

Condições

- Apoio e acompanhamento à produção por parte dos departamentos de arquitetura de informação, design e informática e coordenação geral do estágio pelo CEO da Flainar.
- Realização do estágio no ambiente de produção da Flainar (remoto) customizado para o estudante.
- Integração, por fases, dos resultados produzidos ao longo do estágio na versão de produção (pública) da Flainar. Integração acompanhada e validada pelos responsáveis do estágio e equipa técnica da Flainar.
- Toda a propriedade intelectual do que vier a ser desenvolvido será pertença da Flainar e não poderá ser implementado noutros contextos. Esta condição não é aplicada aos conceitos tecnológicos isolados per si, como por exemplo, o que diga respeito aos modelos de PLN ou design aplicados e desenvolvidos e que não se relacionem com informação e know-how Flainar entregues ao aluno visando o respetivo desenvolvimento na interseção com o modelo de negócio e cultural Flainar.
- Obrigação de confidencialidade em torno do que vier a ser desenvolvido no contexto do modelo de negócio, tecnológico e cultural da Flainar.
- Possibilidade de publicação académica seguindo regras de reserva sobre o contexto do modelo de negócio, tecnológico e cultural da Flainar e a ser validado pelas partes, mas sem que se levantem obstáculos à criação de ciência a partir do trabalho desenvolvido. Identificação da Flainar seguindo as regras de confidencialidade estabelecidas.

Perfil
- Motivação para a pesquisa e desenvolvimento.
- Atitude orientada para o fazer acontecer.
- Disponibilidade para a partilha de conhecimento e dinâmicas de equipa da Flainar.
- Elevado sentido ético e alinhamento com a missão sociocultural da Flainar.

Observações

Do lado do DEI, o estágio deverá ser orientado pelo Professor Hugo Oliveira.
Possibilidade de integração futura do aluno em trabalhos remunerados da Flainar e/ou na sua equipa técnica.

Orientador

Carlos Manuel Moita de Figueiredo
carlos.figueiredo@flainar.com 📩