Titulo Estágio
Tra-la-Lyrics 2.0: geração de texto com base em ritmo
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
DEI/FCTUC
Enquadramento
A Criatividade Computacional é uma área emergente dentro da Inteligência Artificial que visa a modelação e o desenvolvimento de sistemas computacionais que exibam comportamentos possam ser considerados criativos.
Destacam-se sistemas capazes de compor música, gerar arte visual, construir texto humorístico, ou escrever poesia. Na última década, o grupo CMS do CISUC tem sido ativo na área e está atualmente envolvido em dois projetos Europeus, o PROSECCO e o ConCreTe.
O Tra-la-Lyrics [1] gera texto em português que segue o ritmo de música fornecida. Além de conclusões sobre o ritmo do texto, foi utilizado para gerar letras com rimas bem presentes. Na altura, a escassez de recursos impediu o tratamento da semântica, que se reflete no pouco sentido do texto gerado.
O poeta artificial PoeTryMe [2] é mais recente e tem a capacidade de gerar texto que segue uma métrica, usa rimas, transmite sentimento e com uma ligação semântica entre as palavras. Mas não lida com o ritmo.
Objetivo
O objectivo desta dissertação passa pelo desenvolvimento de uma nova versão do Tra-la-Lyrics, em que haja preocupações semânticas. Isto poderá implicar a adaptação de componentes existentes na versão anterior do Tra-la-Lyrics, nomeadamente aquelas que tratam o tratamento do ritmo das palavras portuguesas, e a sua combinação com métodos para garantir coerência semântica, eventualmente inspirados no PoeTryMe.
Um ponto importante passará pela definição de uma ou várias estratégias que consigam lidar com as várias restrições que se colocam ao nível do ritmo, da sintaxe, da semântica, e possivelmente outras que possam aumentar o interesse dos resultados, tais como a ocorrência de rimas, a utilização de recursos estilísticos como a aliteração, ou a transmissão de um sentimento.
No caso do português, e ao contrario de quando a primeira versão do Tra-la-Lyrics foi desenvolvida, existem hoje vários recursos computacionais que podem ser explorados, incluindo léxicos com informação morfológica das palavras, redes semânticas (algumas desenvolvidas no CMS), léxicos de sentimento, sem excluir várias coleções de texto livres que também podem ser exploradas.
Além do desenvolvimento do novo sistema, a dissertação inclui uma forte componente experimental que tem como objectivo aferir a qualidade das soluções propostas.
Plano de Trabalhos - Semestre 1
- Revisão bibliográfica e estado da arte
- Familiarização com o Tra-la-Lyrics e com o PoeTryMe
- Definição de uma primeira estratégia de geração
- Desenvolvimento de um primeiro protótipo para demonstração de conceito
- Elaboração da proposta de dissertação
Plano de Trabalhos - Semestre 2
- Testes e experimentação
- Evolução contínua , do protótipo inicial e eventual desenvolvimento de novas soluções
- Avaliação das soluções
- Elaboração da dissertação
- Escrita de um artigo científico
Condições
O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores. O trabalho será integrado no projeto europeu ConCreTe (Concept Creation Technology) e é elegível a remuneração, através de uma bolsa no âmbito deste projeto.
Observações
Referências:
[1] Hugo Gonçalo Oliveira, F. Amílcar Cardoso, F. Câmara Pereira , Tra-la-Lyrics: An approach to generate text based on rhythm. In Proceedings of the 4th joint workshop on Computational Creativity (IJWCC'07), London, UK, 2007.
[2] Hugo Gonçalo Oliveira. PoeTryMe: a versatile platform for poetry generation. In Proceedings of the ECAI 2012 Workshop on Computational Creativity, Concept Invention, and General Intelligence, C3GI 2012, Montpellier, France, August 2012.
Orientador
Hugo Gonçalo Oliveira e Amílcar Cardoso
hroliv@dei.uc.pt 📩