Propostas submetidas

DEI - FCTUC
Gerado a 2024-05-04 02:38:41 (Europe/Lisbon).
Voltar

Titulo Estágio

Geração automática de perguntas e respostas a partir de documentos

Áreas de especialidade

Sistemas Inteligentes

Engenharia de Software

Local do Estágio

Instituto Pedro Nunes, Coimbra

Enquadramento

No âmbito de uma contratação que o IPN LIS tem com uma empresa que possui um produto de software na área de formação profissional usando técnicas de gamification, o qual consiste em jogos de perguntas, pretende-se implementar uma ferramenta que agilize o processo de criação de novos jogos, mais especificamente na criação das perguntas e correspondentes respostas, através de metodologias de extração de conhecimento e geração de perguntas usando técnicas e algoritmos da área de Natural Language Processing (NLP).
A ferramenta a implementar deverá ter como input documentos que contêm conhecimento relacionado com um determinado tema, e deverá dar como output perguntas e respostas sobre o conteúdo do texto.
O tema de extracção de conhecimento e geração de perguntas de forma automática tem sido abordado pela comunidade científica nas últimas décadas [1, 2, 3, 4], e a qualidade dos resultados tem acompanhado as evoluções na área de NLP.
O candidato a estágio deverá fazer um estudo aprofundado do Estado da Arte relacionado com o tema de forma a determinar as técnicas a usar no desenvolvimento da ferramenta.

[1] Yuan, Xingdi, et al. "Machine comprehension by text-to-text neural question generation." arXiv preprint arXiv:1705.02012 (2017).
[2] Aquino, Jessica Franz, et al. "Text2Test: Question generator utilizing information abstraction techniques and question generation methods for narrative and declarative text." Proceedings of the 8th National Natural Language Processing Research Symposium. 2011.
[3] Kumar, Vishwajeet, Ganesh Ramakrishnan, and Yuan-Fang Li. "Putting the horse before the cart: A generator-evaluator framework for question generation from text." Proceedings of the 23rd Conference on Computational Natural Language Learning (CoNLL). 2019.
[4] Aldabe, Itziar, et al. "Arikiturri: an automatic question generator based on corpora and nlp techniques." International Conference on Intelligent Tutoring Systems. Springer, Berlin, Heidelberg, 2006.

Objetivo

No contexto deste estágio pretende-se investigar e desenvolver uma ferramenta capaz de extrair perguntas, e respostas para essas perguntas, de documentos, fazendo uso de técnicas e algoritmos de Natural Language Processing.

Plano de Trabalhos - Semestre 1

Durante o 1º semestre, o projeto será composto pelas seguintes fases de desenvolvimento:
• F1 – Análise do estado da arte (40% do semestre) – Análise de soluções, boas práticas e as tecnologias a usar no projeto. Estudo do estado da arte sobre extração e geração de perguntas de forma automática ou assistida a partir de documentos;
• F2 – Levantamento de requisitos (30% do semestre) – esta tarefa consiste no levantamento de requisitos dos módulos a desenvolver, nomeadamente quais as tecnologias/ frameworks/ libraries/ APIs a utilizar;
• F3 – Desenho (30% do semestre) – Definição da arquitetura preliminar do sistema; Realização de experiências com as tecnologias candidatas;

Nota: o relatório para defesa intermédia do estágio deverá ser escrito ao longo do semestre.

Plano de Trabalhos - Semestre 2

Durante o 2º semestre, o projeto será composto pelas seguintes fases:
• F4 – Implementação (70% do semestre) – Configuração dos ambientes de desenvolvimento, teste e exploração; Implementação dos requisitos especificados em F2, seguindo as decisões arquiteturais tomadas em F3. O desenvolvimento deverá seguir a metodologia Test-Driven Development, com a implementação de testes unitários e de integração.
• F5 – Testes (30% do semestre) – Desenvolvimento de testes funcionais ao sistema, para verificação dos requisitos. Implementação de correções aos erros detetados.
Nota: o relatório para defesa final do estágio deverá ser escrito ao longo do semestre.

Condições

Bolsa no valor de 400€ /mês durante um período de 6 meses, mediante avaliação do estagiário a ocorrer no fim do primeiro semestre. O valor pode ser revisto em alta aquando da avaliação.
O trabalho será realizado no Laboratório de Informática e Sistemas (LIS) do Instituto Pedro Nunes (IPN).

Observações

.

Orientador

Hugo Dinis Pereirinha da Silva Amaro
hamaro@ipn.pt 📩