Dissertação/Estágio - Atribuídos em Plurianual 2014/2015 - 2015/2016

DEI - FCTUC

Dissertação/Estágio - Atribuidos em Plurianual 2014/2015  -  2015/2016

Gerado a 2024-04-26 11:02:14 (Europe/Lisbon).
Voltar

Titulo Estágio

Geração automática de humor em português

Áreas de especialidade

Sistemas Inteligentes

Local do Estágio

DEI/FCTUC

Enquadramento

A Criatividade Computacional é uma subárea emergente da Inteligência Artificial que visa o desenvolvimento de sistemas computacionais que exibam comportamentos que possam ser considerados criativos.

Destacam-se sistemas capazes de compor música, gerar arte visual, escrever poesia ou construir texto humorístico. Na última década, o grupo CMS do CISUC tem sido ativo na área e está atualmente envolvido em dois projetos Europeus, o PROSECCO e o ConCreTe.

A geração automática de humor tem sido explorada por vários autores e abrange já a geração de trocadilhos pergunta-resposta [1], como:
What do you call a murderer that has fibre? A cereal killer.

Ou de frases humorísticas utilizando palavras tabu [2], como:
Let everything turn on well with you wife

No último caso, foi substituída uma palavra por outra com um som semelhante e que pode ser considerada um tabu. Anteriormente, além de semelhanças fonéticas, foi considerado o significado da pergunta e a sua relação com a resposta.

Objetivo

A maioria dos sistemas de humor computacional são dedicados ao inglês. Não temos conhecimento de nada semelhante para o português.

Nesta dissertação pretende-se realizar um trabalho pioneiro na exploração de técnicas de humor computacional, aplicadas à língua portuguesa. O trabalho deverá culminar na implementação de um ou vários protótipos capazes de produzir, automaticamente, texto com propriedades humorísticas, de preferência com algum grau de novidade e capacidade de surpreender os utilizadores.

Tal como nos sistemas desenvolvidos para o inglês, algumas das técnicas a aplicar poderão passar pela substituição de palavras com o sons semelhantes, mantendo o texto gramaticalmente coerente, ou pela exploração de relações entre palavras ou ambiguidades semânticas, como acontece no caso seguinte, com ‘bandidos’ e ‘crimes’, e ‘onda’:

O que acontece quando dois bandidos caem ao mar?
Há uma onda de crimes.

As ideias anteriores podem também ser combinadas, como no caso seguinte, em que há uma relação forte entre ‘espaço’ e ‘vácuo’ que, por sua vez, tem um som parecido com ‘vaca’:

Porquê que a vaca foi para o espaço?
Para se encontrar com o vácuo.

Conhecimento acerca das relações entre palavras e dos seus possíveis significados encontra-se normalmente em bases de conhecimento lexical. Nos últimos anos, algumas dessas bases de conhecimento foram desenvolvidas no grupo CMS (CARTÃO, Onto.PT), e poderão ser exploradas para a realização este trabalho.

Plano de Trabalhos - Semestre 1

- Estudo do estado da arte relativamente a humor computacional
- Levantamento de técnicas adaptáveis à geração de trocadilhos humorísticos
- Definição de um primeiro modelo de humor a gerar
- Implementação de um primeiro protótipo para demonstração de conceito
- Elaboração da proposta de dissertação

Plano de Trabalhos - Semestre 2

- Testes e experimentação
- Evolução do protótipo inicial e eventual criação de novos modelos/protótipos
- Avaliação dos resultados obtidos
- Elaboração da dissertação
- Escrita de artigo científico

Condições

O local de trabalho será o laboratório de investigação do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores. O trabalho será integrado no projeto europeu ConCreTe (Concept Creation Technology) e é elegível a remuneração, através de uma bolsa no âmbito deste projeto.

Observações

Referências:

[1] Kim Binsted and Graeme Ritchie. (1994). An implemented model of punning riddles. In Proceedings of the 12th National Conference on Artificial Intelligence (AAAI-94), Seattle, USA.

[2] Alessandro Valitutti, Hannu Toivonen, Antoine Doucet and Jukka Toivanen (2013) . "Let Everything Turn Well in Your Wife": Generation of Adult Humor Using Lexical Constraints. The 51st Annual Meeting of the Association for Computational Linguistics - Short Papers. Sofia, Bulgaria.

Orientador

Hugo Gonçalo Oliveira e Alexandre Pinto
hroliv@dei.uc.pt 📩