Titulo Estágio
PRINTF: Ferramenta Computacional para Previsão e Análise Inteligente de Redes de Interação de Proteínas
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
CISUC - Centro de Informática e Sistemas da Universidade de Coimbra
Enquadramento
Nos últimos anos assistiu-se a um aumento sem precedentes de dados biomédicos, potenciado por avanços tecnológicos sucessivos. Contudo, o conhecimento existente encontra-se disperso sobre inúmeras bases de dados independentes. Ser capaz de fundir estes dados e de extrair evidencias biomoleculares relevantes é um enorme desafio mas também uma excelente oportunidade. Não sendo realista a execução manual desta tarefa manualmente existe uma premente necessidade de estratégias computacionais que permitam responder a este problema.
Um problema concreto de especial interesse consiste em analisar as interações de proteínas (PPI – Protein-Protein Interaction). A capacidade de prever estas interações proporciona informação valiosa, permitindo compreender de forma sistemática o mecanismo de funcionamento de várias doenças.
Objetivo
Neste projeto, pretende-se construir uma ferramenta computacional usando algoritmos inteligentes para construção e análise de redes de interação de proteínas (PPIs). O sistema deverá ser capaz de efetuar a previsão de interações através da utilização de algoritmos de classificação inteligente, incluindo em particular as máquinas de aprendizagem de vetores de suporte (SVM). Deverão ser implementados e avaliados diferentes classificadores com base nas características das proteínas, construídas essencialmente a partir de domínios conservados e estrutura primária.
Depois de detetadas as interações, estas podem ser facilmente visualizadas através das designadas redes de interação. A ferramenta computacional a desenvolver deverá permitir a predição e posterior visualização e análise das interações.
Plano de Trabalhos - Semestre 1
1. Estudo do problema e revisão do estado da arte (com foco no estudo de ferramentas computacionais para a identificação de interações entre proteínas);
2. Revisão do estado da arte de algoritmos inteligentes para classificação de proteínas;
3. Definição e construção dos repositórios de dados de treino, validação e teste;
4. Desenvolvimento e teste de classificadores;
5. Validação preliminar do modelo obtido;
6. Escrita do relatório intermédio.
Plano de Trabalhos - Semestre 2
7. Análise comparativa dos resultados obtidos com outros modelos de classificação e conjuntos de dados;
8. Validação das metodologias para a análise do Interactoma Humano;
9. Desenvolvimento da ferramenta computacional para visualização da redes de interações;
10. Escrita da versão final da dissertação.
Condições
O aluno terá acesso às salas do grupo de Computação Adaptativa e a um cluster de computadores. Esta é uma excelente oportunidade para adquirir experiência em Bioinformática, uma área com enorme potencial de crescimento.
Dependendo de disponibilidade financeira, perspetiva-se a abertura de concurso para concessão de uma bolsa de investigação. Os estudantes interessados nesta proposta são encorajados a contactar os orientadores.
Orientador
Carlos Pereira; Joel P. Arrais
jpa@dei.uc.pt 📩