Titulo Estágio
Geração de Datasets Sintéticos para Treino de Redes Neuronais em Visão Computacional
Local do Estágio
Instituto Pedro Nunes, Edifício D, Rua Pedro Nunes, 3030-199 Coimbra
Enquadramento
A Visão Computacional é uma área crucial para diversas aplicações tecnológicas, incluindo segurança, automação industrial, saúde e entretenimento. O sucesso de modelos de deep learning, especialmente redes neuronais convolucionais (CNNs), na detecção de objetos depende em grande parte da disponibilidade e qualidade dos dados de treino. No entanto, a obtenção de grandes volumes de dados rotulados e diversificados pode ser um desafio significativo. Neste contexto, a criação de datasets sintéticos surge como uma solução promissora para suprir a necessidade de dados de treino diversificados e abundantes.
Este estágio tem como objetivo investigar e desenvolver técnicas para a criação de datasets sintéticos que possam ser utilizados no treino de redes neuronais para a detecção de objetos. A geração de dados sintéticos permite não apenas aumentar a quantidade de dados de treino, mas também controlar as variáveis e cenários específicos necessários para o desenvolvimento de modelos robustos e generalizáveis.
O estagiário terá a oportunidade de explorar diversas metodologias para a criação de dados sintéticos, incluindo a utilização de técnicas de renderização 3D, IA Generativa, Data Augmentation e outras. Este estágio oferece um ambiente propício para aplicar conhecimentos teóricos em contextos práticos, contribuindo para a inovação e eficiência no campo da Visão Computacional.
Objetivo
- Estudar os conceitos fundamentais de Visão Computacional e deep learning.
- Compreender a importância e os desafios da criação de datasets sintéticos para treino de redes neuronais.
- Investigar metodologias e ferramentas para a geração de dados sintéticos, como renderização 3D, IA Generativa, Data Augmentation e outras.
- Desenvolver e implementar técnicas para criar datasets sintéticos diversificados e realistas.
- Avaliar a eficácia dos datasets sintéticos no treino de modelos de detecção de objetos.
- Documentar todo o processo de criação e validação dos datasets sintéticos, apresentando os resultados obtidos.
Plano de Trabalhos - Semestre 1
Semana 1-2: Introdução e Orientação:
- Introdução aos conceitos fundamentais de Visão Computacional, deep learning e datasets sintéticos.
- Apresentação dos objetivos e expectativas do estágio.
- Formação sobre as ferramentas e plataformas a serem utilizadas durante o estágio.
Semana 3-6: Pesquisa e Levantamento de Informação:
- Revisão bibliográfica sobre técnicas de geração de dados sintéticos.
- Estudo das metodologias atuais utilizadas na criação de datasets sintéticos para Visão Computacional.
Semana 7-10: Definição dos Requisitos do Projeto:
- Identificação dos requisitos específicos para a criação de datasets sintéticos.
- Definição das métricas de sucesso e critérios de avaliação dos datasets gerados.
Semana 11-14: Investigação de Técnicas de Geração de Dados Sintéticos:
- Pesquisa sobre técnicas de renderização 3D, geração procedimental e simulações.
- Avaliação das vantagens e limitações de cada técnica.
Semana 15-18: Planeamento da Criação de Datasets:
- Desenho do plano para a geração de datasets sintéticos.
- Discussão sobre a infraestrutura necessária para a criação e armazenamento dos dados.
Semana 19-20: Preparação do Relatório Intermédio:
- Redação de um relatório de estágio intermédio detalhando o trabalho realizado no primeiro semestre.
- Revisão e submissão do relatório intermédio.
Plano de Trabalhos - Semestre 2
Semana 1-4: Implementação Inicial das Técnicas de Geração:
- Desenvolvimento e implementação das técnicas selecionadas para a criação de datasets sintéticos.
- Geração inicial de um conjunto de dados sintéticos para testes preliminares.
Semana 5-8: Aperfeiçoamento dos Datasets Sintéticos:
- Refinamento das técnicas de geração com base nos resultados dos testes iniciais.
- Aumento da diversidade e realismo dos dados sintéticos gerados.
Semana 9-12: Treino de Modelos com Dados Sintéticos:
- Utilização dos datasets sintéticos para treinar modelos de redes neuronais convolucionais (CNNs).
- Avaliação da eficácia dos dados sintéticos no treino dos modelos.
Semana 13-16: Testes e Validação:
- Realização de testes rigorosos dos modelos treinados com dados sintéticos.
- Comparação do desempenho dos modelos treinados com dados sintéticos e dados reais.
- Recolha de feedback dos utilizadores e stakeholders.
Semana 17-18: Ajustes Finais:
- Implementação dos ajustes finais nas técnicas de geração de dados sintéticos e nos modelos treinados com base no feedback recebido.
Semana 19-20: Preparação do Relatório Final:
- Elaboração do relatório final de estágio, documentando todo o processo de criação de datasets sintéticos, treino de modelos, testes, resultados e conclusões.
- Revisão e submissão do relatório final.
Condições
- Bolsa de Investigação (FCT) no valor de 990,98€ (no 1.º semestre o valor é proporcional ao tempo trabalhado).
- Recursos computacionais cedidos pela Present Technologies
- Acesso a formação interna permanente(aulas de inglês semanais, formações técnicas,licença da Udemy)
- Acesso a medidas de bem-estar (e.g. Pilates, atividades de teambuilding,...)
- Designação de um Mentor
- Possibilidade de integração nos quadros da empresa no final do estágio.
Observações
Serão realizadas entrevistas.
Orientador
Nuno Pedro da Silva Rodrigues
nuno.rodrigues@present-technologies.com 📩