Propostas de Estágio 2011/2012

DEI - FCTUC
Gerado a 2024-05-01 23:27:52 (Europe/Lisbon).
Voltar

Titulo Estágio

Geração de texto com base em ritmo

Área Tecnológica

Inteligência Artificial

Local do Estágio

Laboratórios do CMS (DEI)

Enquadramento

A geração automática de texto é um tópico de investigação que tem registado grandes avanços nos últimos anos, em parte devido à sua enorme aplicabilidade prática, mas também graças à evolução que se tem verificado nas técnicas de processamento de linguagem natural e na qualidade dos recursos linguísticos disponíveis.
O processo de geração tem, em regra geral, como entrada uma descrição semântica (o significado da mensagem que se quer transmitir) e inclui a construção de frases de acordo com um conjunto de regras gramaticais, bem como a escolha de palavras de um léxico.

Em muitas aplicações de índole artístico (e também em algumas aplicações educativas), o “ritmo das palavras” pode ter importância comparável à do seu próprio significado. No cinema, no teatro, na generalidade das artes performativas, um texto pode ter que se adaptar a uma banda sonora; por vezes o ritmo sugerido pelo texto é tão conseguido que o próprio texto constitui a banda sonora ou serve de guia para a sua composição. Em certos estilos musicais, o ritmo do texto é elemento essencial da linguagem estética.

O Tra-la-Lyrics [1] foi uma aplicação desenvolvida no grupo CMS do CISUC com o objectivo de gerar letras em português que seguissem o ritmo de músicas fornecidas. Algumas conclusões interessantes foram tiradas acerca de como o texto deve respeitar determinado ritmo e foi ainda possível gerar letras com propriedades como a utilização de rimas ou repetição de palavras. O texto gerado não fazia no entanto grande sentido essencialmente porque, para o português, os recursos semânticos públicos eram escassos.

Entretanto, tem vindo a ser realizado trabalho com o objectivo de criar recursos semânticos de larga cobertura para a nossa língua, de onde se destaca o Onto.PT [2], que está ser desenvlvido no laboratório Knowledge and Intelligent Systems do grupo CMS do CISUC.

O Onto.PT tem como principal objectivo a criação de uma ontologia lexical para a língua portuguesa, construída automaticamente a partir de vários recursos textuais disponíveis para a nossa língua. É actualmente constituído por: conceitos, descritos por palavras ou grupos de palavras; e relações entre o significado das palavras, como a hiperonímia ou is-a (um conceito é um tipo de outro) e a meronímia ou part-of (um conceito é parte de outro).

Objetivo

O objectivo desta dissertação é o desenvolvimento de soluções que permitam a construção de textos simples que se adaptem a sequências rítmicas, e que consigam ao mesmo tempo transmitir uma mensagem com algum sentido.

A ideia será partir das conclusões acerca da ritmo, obtidas com o Tra-la-Lyrics, e com a utilização do Onto.PT, e eventualmente outros recursos, construir um sistema que consiga fazer uma escolha de vocábulos que respeitem determinada métrica e que transmitam determinada mensagem. O resultado poderá ser um poema, uma letra para uma música ou outro tipo de texto com restrições ao nível do ritmo.

A dissertação inclui uma componente de experimentação que tem como objectivo aferir a qualidade das soluções propostas.

Plano de Trabalhos - Semestre 1

• Revisão bibliográfica e estado da arte
• Estudo da estrutura do Onto.PT
• Desenvolvimento de um protótipo simples para demonstração de conceito
• Elaboração da proposta de dissertação

Plano de Trabalhos - Semestre 2

• Desenvolvimento de soluções de acordo com o plano de investigação da proposta
• Testes e experimentação
• Elaboração da dissertação
• Escrita de um artigo científico

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC.
O estágio não é remunerado.

Observações

Referências
[1] H. Gonçalo Oliveira, A. Cardoso, F.C. Pereira , Tra-la-Lyrics: An approach to generate text based on rhythm, in Wiggins & Cardoso editors, Proceedings of the 4th joint workshop on Computational Creativity (IJWCC'07), London
[2] Hugo Gonçalo Oliveira and Paulo Gomes. Onto.PT: Automatic Construction of a Lexical Ontology for Portuguese. In Proceedings of 5th European Starting AI Researcher Symposium (STAIRS 2010), IOS Press 2010.

Orientador

Hugo Oliveira e Amilcar Cardoso
amilcar@dei.uc.pt 📩