Titulo Estágio
Geração de texto com base em ritmo
Área Tecnológica
Inteligência Artificial
Local do Estágio
Laboratórios do CMS (DEI)
Enquadramento
A geração automática de texto é um tópico de investigação que tem registado grandes avanços nos últimos anos, em parte devido à sua enorme aplicabilidade prática, mas também graças à evolução que se tem verificado nas técnicas de processamento de linguagem natural e na qualidade dos recursos linguísticos disponíveis.
O processo de geração tem, em regra geral, como entrada uma descrição semântica (o significado da mensagem que se quer transmitir) e inclui a construção de frases de acordo com um conjunto de regras gramaticais, bem como a escolha de palavras de um léxico.
Em muitas aplicações de índole artístico (e também em algumas aplicações educativas), o “ritmo das palavras” pode ter importância comparável à do seu próprio significado. No cinema, no teatro, na generalidade das artes performativas, um texto pode ter que se adaptar a uma banda sonora; por vezes o ritmo sugerido pelo texto é tão conseguido que o próprio texto constitui a banda sonora ou serve de guia para a sua composição. Em certos estilos musicais, o ritmo do texto é elemento essencial da linguagem estética.
O Tra-la-Lyrics [1] foi uma aplicação desenvolvida no grupo CMS do CISUC com o objectivo de gerar letras em português que seguissem o ritmo de músicas fornecidas. Algumas conclusões interessantes foram tiradas acerca de como o texto deve respeitar determinado ritmo e foi ainda possível gerar letras com propriedades como a utilização de rimas ou repetição de palavras. O texto gerado não fazia no entanto grande sentido essencialmente porque, para o português, os recursos semânticos públicos eram escassos.
Entretanto, tem vindo a ser realizado trabalho com o objectivo de criar recursos semânticos de larga cobertura para a nossa língua, de onde se destaca o Onto.PT [2], que está ser desenvlvido no laboratório Knowledge and Intelligent Systems do grupo CMS do CISUC.
O Onto.PT tem como principal objectivo a criação de uma ontologia lexical para a língua portuguesa, construída automaticamente a partir de vários recursos textuais disponíveis para a nossa língua. É actualmente constituído por: conceitos, descritos por palavras ou grupos de palavras; e relações entre o significado das palavras, como a hiperonímia ou is-a (um conceito é um tipo de outro) e a meronímia ou part-of (um conceito é parte de outro).
Objetivo
O objectivo desta dissertação é o desenvolvimento de soluções que permitam a construção de textos simples que se adaptem a sequências rítmicas, e que consigam ao mesmo tempo transmitir uma mensagem com algum sentido.
A ideia será partir das conclusões acerca da ritmo, obtidas com o Tra-la-Lyrics, e com a utilização do Onto.PT, e eventualmente outros recursos, construir um sistema que consiga fazer uma escolha de vocábulos que respeitem determinada métrica e que transmitam determinada mensagem. O resultado poderá ser um poema, uma letra para uma música ou outro tipo de texto com restrições ao nível do ritmo.
A dissertação inclui uma componente de experimentação que tem como objectivo aferir a qualidade das soluções propostas.
Plano de Trabalhos - Semestre 1
• Revisão bibliográfica e estado da arte
• Estudo da estrutura do Onto.PT
• Desenvolvimento de um protótipo simples para demonstração de conceito
• Elaboração da proposta de dissertação
Plano de Trabalhos - Semestre 2
• Desenvolvimento de soluções de acordo com o plano de investigação da proposta
• Testes e experimentação
• Elaboração da dissertação
• Escrita de um artigo científico
Condições
O local de trabalho será o laboratório de investigação do grupo CMS do CISUC.
O estágio não é remunerado.
Observações
Referências
[1] H. Gonçalo Oliveira, A. Cardoso, F.C. Pereira , Tra-la-Lyrics: An approach to generate text based on rhythm, in Wiggins & Cardoso editors, Proceedings of the 4th joint workshop on Computational Creativity (IJWCC'07), London
[2] Hugo Gonçalo Oliveira and Paulo Gomes. Onto.PT: Automatic Construction of a Lexical Ontology for Portuguese. In Proceedings of 5th European Starting AI Researcher Symposium (STAIRS 2010), IOS Press 2010.
Orientador
Hugo Oliveira e Amilcar Cardoso
amilcar@dei.uc.pt 📩