Titulo Estágio
Geração Automática de Criatividade Linguística / Humor em Contexto
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
DEI / CISUC
Enquadramento
A Criatividade Computacional é uma subárea emergente da Inteligência Artificial que visa o desenvolvimento de sistemas computacionais com comportamentos que possam ser considerados criativos. Destacam-se sistemas capazes de compor música, gerar arte visual, escrever poesia ou produzir humor. Na última década, o grupo CMS do CISUC tem sido activo na área com vários trabalhos e participação em projetos europeus.
Dentro da Criatividade Computacional, a criatividade linguística tem como objetivo a geração automática de artefactos como poemas, histórias, humor ou slogans.
Para além das questões de criatividade, esta área está fortemente ligada à Geração de Linguagem Natural, que tem como principal objetivo a produção automática de texto em linguagem humana, e que tem crescido bastante nos últimos anos, com a aplicação em chatbots, jornalismo automático, ou à descrição automática de imagens.
Por exemplo, a geração automática de humor tem dado origem a sistemas que geram vários tipos de piada, tais como one-liners, reescrita de acrónimos ou trocadilhos pergunta-resposta. Outros investigadores trabalharam na geração de artefactos relacionados, como a geração de metáforas criativas, sarcasmo ou de slogans.
Contudo, a maior parte dos trabalhos anteriores tem-se focado no inglês, com uma minoria de trabalhos em português realizada no CISUC, alguns dos quais que resultaram em três bots que funcionam, de forma autónoma, na rede Twitter: O Poeta Artificial (@poetartificial) que gera poemas inspirados nas últimas tendências; o Memegera, que gerava memes com base em notícias recentes (ver @memegera); e o Trocadilhos da Bola, que gerava trocadilhos com nomes de jogadores de futebol (@trocadabola). Isto para além de um sistema gerador de adivinhas humorísticas / piadas secas (Seco).
Há ainda a dizer que há cada vez há mais sistemas inteligentes com os quais é possível interagir através da nossa linguagem, falada ou escrita (vulgo, chatbots). De forma a adoptar um comportamento mais humano, é importante que estes sistemas sejam, também eles, criativos e, por exemplo, capazes de reconhecer e de produzir humor, com base no contexto e no conhecimento que têm disponível.
Objetivo
Este trabalho tem como objetivo explorar formas alternativas para a geração de formas curtas de texto criativo, em português, e baseado num dado contexto, que pode ser dado sob a forma de títulos de notícia recentes ou publicações numa rede social.
O resultado pode ser um novo título / subtítulo, reescrito de forma criativa; uma resposta ao título ou à publicação, recorrendo, por exemplo, a provérbios, slogans, títulos de filme ou de músicas alterados; ou um trocadilho, gerado com base na alteração de determinadas (partes de) palavras.
Este resultado deverá ter valor criativo, por recorrer a linguagem figurativa, rimas, ou até produzir um efeito humorístico.
Para a geração destes resultados deverão ser explorados ferramentas e recursos para o processamento computacional do português que permitam, por um lado, interpretar, até certo ponto, o contexto e, por outro, gerar um novo texto o mais adequado possível. Deve então tirar-se o máximo partido de ferramentas como analisadores sintáticos e detetores de entidades, e recursos como léxicos de sentimento, bases de conhecimento semântico ou modelos de semântica distribucional (word embeddings).
Algumas destas abordagens podem depois ser integradas num bot, por exemplo, na rede Twitter, que publique algumas das criações. Usando como contexto a actualidade noticiosa, esta poderá ser uma forma alternativa e bem-disposta de consultar as notícias do dia.
O mesmo bot poderá tentar responder a tweets que mencionem tendências (trends), ou até funcionar como um chatbot "humorista", que procura sempre responder a interações de forma criativa / com piada.
Dada a subjetividade dos artefatos a gerar, a avaliação deverá recorrer à opinião de humanos e deverá focar-se não só no potencial humorístico, mas também na coerência do texto gerado, tanto ao nível sintático como semântico, e ainda adequação ao contexto.
Plano de Trabalhos - Semestre 1
- Levantamento do estado da arte de Criatividade Computacional, com foco na criatividade linguística
- Análise de requisitos
- Identificação de ferramentas e recursos que possam ser explorados
- Identificação de modelos de geração a implementar
- Elaboração da proposta de dissertação
Plano de Trabalhos - Semestre 2
- Implementação de alguns modelos de geração
- Experimentação e avaliação dos modelos
- Integração dos modelos num bot, por exemplo, na rede Twitter
- Elaboração da dissertação
- Escrita de artigo científico
Condições
O local de trabalho será o laboratório de investigação do grupo CMS do CISUC, onde haverá um acompanhamento regular por parte do orientador.
Observações
Durante a fase de candidatura, dúvidas relacionadas com esta proposta, nomeadamente acerca dos objectivos e condições, devem ser esclarecidas com o orientador, através de e-mail (hroliv@dei.uc.pt) ou de uma reunião presencial, a marcar após um contacto por e-mail.
Orientador
Hugo Gonçalo Oliveira
hroliv@dei.uc.pt 📩