Titulo Estágio
Geração-interpretação de quimeras como augmentação de dados
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
Rua Sílvio Lima, 3030-290 Coimbra
Enquadramento
O Instituto de Sistemas e Robótica (ISR) é um centro de investigação com sede na Universidade de Coimbra. O ISR tem como objetivo global criar uma equipa de investigação multidisciplinar excelente, capaz de realizar investigação em diferentes áreas da ciência e tecnologia. O laboratório Sistemas Imersivos e Laboratório de Estimulação Sensorial (IS3L – is3l.isr.uc.pt) surgiu em 2019, com o propósito de explorar e resolver variados desafios nas áreas de Machine Learning, Computação Neurocognitiva e Afectiva, Realidade Virtual e Aumentada, Reabilitação, entre outras.
No contexto temático deste projeto, o foco incide sobretudo na área de machine learning, prevendo desde a concepção à implementação de mecanismos de augmentação de dados, podendo culminar tanto em aplicações artísticas como em contribuições objectivas a aprendizagem artificial autónoma.
Objetivo
O problema de overfitting é latente na área de deep learning. Este impede a aprendizagem contínua em redes neuronais artificiais dependentes em big data, cuja falta inevitavelmente leva à denegrição e estagnação de performance. Este estudo tem como objectivo apresentar possíveis soluções ao overfitting consequentes da interpretação autónoma de dados auto-gerados pela livre mistura de conhecimentos pré-adquiridos (quimeras). Como tal o trabalho pressupõe um robusto estudo de redes neuronais artificiais e respectivos subtemas, sendo que as ferramentas a utilizar serão oportunamente acordadas entre aluno e orientadores. Os objetivos gerais deste trabalho são então os seguintes:
1) Pesquisa de Estado da Arte; 2) Esboço de ideias;
3) Implementação e testagem; 4) Análise e interpretação
5) Apresentação.
Nota: O trabalho será desenvolvido usando dois datasets com 10 classes: o MNIST numa primeira fase e numa segunda fase o CIFAR-10.
Plano de Trabalhos - Semestre 1
O plano de trabalhos que se segue é apenas um esboço do que é pretendido, podendo o mesmo ser reestruturado.
Fase 1 - Introdução a redes neuronais, problema de overfitting e augmentação de dados através da pesquisa de abordagens estado-da-arte, com vista a uma robusta familiarização com o tema.
Fase 2 - Estudo de processos baseados em ascensão de gradiente para a geração de dados não observados previamente.
Fase 3 - Análise de algoritmia altamente abstractiva para categorização robusta à falta de dados etiquetados.
Fase 4 - Preparação e escrita do relatório intermédio
Plano de Trabalhos - Semestre 2
Fase 5 - Implementação das técnicas estudadas e eventual fusão como potencial mecanismo de augmentação de dados e prevenção de overfitting.
Fase 6 - Testagem exaustiva dos mecanismos implementados e estruturação da dissertação.
Fase 7 - Escrita do relatório final
Condições
O ISR dispõe dos recursos computacionais para o treino de redes neuronais. O estudante terá acesso ao laboratório no qual terá um posto de trabalho com as contições necessárias para o desenvolvimento.
O estudante fará parte da equipa do IS3L e deverá participar nas atividades da mesma que incluem reuniões informais e reuniões formais semanais, workshops, etc.
Observações
O trabalho de estágio será desenvolvido beneficiará da colaboração e apoio do Mestre Gustavo Assunção.
Orientador
Paulo Jorge Carvalho Menezes
paulomenezes@isr.uc.pt 📩