Propostas atribuidas 2024/2025

DEI - FCTUC
Gerado a 2024-07-17 07:15:32 (Europe/Lisbon).
Voltar

Titulo Estágio

Geração de Datasets Sintéticos para Treino de Redes Neuronais em Visão Computacional

Áreas de especialidade

Sistemas Inteligentes

Sistemas Inteligentes

Local do Estágio

Instituto Pedro Nunes, Edifício D, Rua Pedro Nunes, 3030-199 Coimbra

Enquadramento

A Visão Computacional é uma área crucial para diversas aplicações tecnológicas, incluindo segurança, automação industrial, saúde e entretenimento. O sucesso de modelos de deep learning, especialmente redes neuronais convolucionais (CNNs), na detecção de objetos depende em grande parte da disponibilidade e qualidade dos dados de treino. No entanto, a obtenção de grandes volumes de dados rotulados e diversificados pode ser um desafio significativo. Neste contexto, a criação de datasets sintéticos surge como uma solução promissora para suprir a necessidade de dados de treino diversificados e abundantes.

Este estágio tem como objetivo investigar e desenvolver técnicas para a criação de datasets sintéticos que possam ser utilizados no treino de redes neuronais para a detecção de objetos. A geração de dados sintéticos permite não apenas aumentar a quantidade de dados de treino, mas também controlar as variáveis e cenários específicos necessários para o desenvolvimento de modelos robustos e generalizáveis.

O estagiário terá a oportunidade de explorar diversas metodologias para a criação de dados sintéticos, incluindo a utilização de técnicas de renderização 3D, IA Generativa, Data Augmentation e outras. Este estágio oferece um ambiente propício para aplicar conhecimentos teóricos em contextos práticos, contribuindo para a inovação e eficiência no campo da Visão Computacional.

Objetivo

- Estudar os conceitos fundamentais de Visão Computacional e deep learning.
- Compreender a importância e os desafios da criação de datasets sintéticos para treino de redes neuronais.
- Investigar metodologias e ferramentas para a geração de dados sintéticos, como renderização 3D, IA Generativa, Data Augmentation e outras.
- Desenvolver e implementar técnicas para criar datasets sintéticos diversificados e realistas.
- Avaliar a eficácia dos datasets sintéticos no treino de modelos de detecção de objetos.
- Documentar todo o processo de criação e validação dos datasets sintéticos, apresentando os resultados obtidos.

Plano de Trabalhos - Semestre 1

Semana 1-2: Introdução e Orientação:
- Introdução aos conceitos fundamentais de Visão Computacional, deep learning e datasets sintéticos.
- Apresentação dos objetivos e expectativas do estágio.
- Formação sobre as ferramentas e plataformas a serem utilizadas durante o estágio.

Semana 3-6: Pesquisa e Levantamento de Informação:
- Revisão bibliográfica sobre técnicas de geração de dados sintéticos.
- Estudo das metodologias atuais utilizadas na criação de datasets sintéticos para Visão Computacional.

Semana 7-10: Definição dos Requisitos do Projeto:
- Identificação dos requisitos específicos para a criação de datasets sintéticos.
- Definição das métricas de sucesso e critérios de avaliação dos datasets gerados.

Semana 11-14: Investigação de Técnicas de Geração de Dados Sintéticos:
- Pesquisa sobre técnicas de renderização 3D, geração procedimental e simulações.
- Avaliação das vantagens e limitações de cada técnica.

Semana 15-18: Planeamento da Criação de Datasets:
- Desenho do plano para a geração de datasets sintéticos.
- Discussão sobre a infraestrutura necessária para a criação e armazenamento dos dados.

Semana 19-20: Preparação do Relatório Intermédio:
- Redação de um relatório de estágio intermédio detalhando o trabalho realizado no primeiro semestre.
- Revisão e submissão do relatório intermédio.

Plano de Trabalhos - Semestre 2

Semana 1-4: Implementação Inicial das Técnicas de Geração:
- Desenvolvimento e implementação das técnicas selecionadas para a criação de datasets sintéticos.
- Geração inicial de um conjunto de dados sintéticos para testes preliminares.

Semana 5-8: Aperfeiçoamento dos Datasets Sintéticos:
- Refinamento das técnicas de geração com base nos resultados dos testes iniciais.
- Aumento da diversidade e realismo dos dados sintéticos gerados.

Semana 9-12: Treino de Modelos com Dados Sintéticos:
- Utilização dos datasets sintéticos para treinar modelos de redes neuronais convolucionais (CNNs).
- Avaliação da eficácia dos dados sintéticos no treino dos modelos.

Semana 13-16: Testes e Validação:
- Realização de testes rigorosos dos modelos treinados com dados sintéticos.
- Comparação do desempenho dos modelos treinados com dados sintéticos e dados reais.
- Recolha de feedback dos utilizadores e stakeholders.

Semana 17-18: Ajustes Finais:
- Implementação dos ajustes finais nas técnicas de geração de dados sintéticos e nos modelos treinados com base no feedback recebido.

Semana 19-20: Preparação do Relatório Final:
- Elaboração do relatório final de estágio, documentando todo o processo de criação de datasets sintéticos, treino de modelos, testes, resultados e conclusões.
- Revisão e submissão do relatório final.

Condições

- Bolsa de Investigação (FCT) no valor de 990,98€ (no 1.º semestre o valor é proporcional ao tempo trabalhado).
- Recursos computacionais cedidos pela Present Technologies
- Acesso a formação interna permanente(aulas de inglês semanais, formações técnicas,licença da Udemy)
- Acesso a medidas de bem-estar (e.g. Pilates, atividades de teambuilding,...)
- Designação de um Mentor
- Possibilidade de integração nos quadros da empresa no final do estágio.

Observações

Serão realizadas entrevistas.

Orientador

Nuno Pedro da Silva Rodrigues
nuno.rodrigues@present-technologies.com 📩