Titulo Estágio
Machine Learning
Áreas de especialidade
Sistemas de Informação
Local do Estágio
Lisboa
Enquadramento
Com um volume de informação cada vez maior e diferentes tipologias de informação, os métodos de análise de informação requerem sistemas cada vez mais sofisticados para detectar padrões e clusters de informação relevantes para tomada de decisão. Os tradicionais modelos preditivos são cada vez mais onerosos de manter para organizações que requerem uma contante adaptação a uma realidade em permanente mudança. Assim, modelos baseados em Machine Learning, onde a aprendizagem é efectuada pela própria capacidade computacional, permitem um ajuste continuo e modelização de cenários nunca antes antecipados.
Objetivo
Análise comparativa de técnicas e ferramentas de Machine Learning, procurando identificar as que mais se ajustam à tipologia de informação de instituições financeira (banca e seguros).
Utilização de soluções de Machine Learning, recorrendo a técnicas de paralelização de trabalho e de plataformas MPP. Pretende-se a utilização de Apache Spark, MLlib e Apache Mahout.
Aplicação de novas técnicas de modelização a processos e algoritmos já tradicionais (credit scoring, tarifação, etc.), mas tirando partido de capacidades de processamento e trabalho em matrizes de dimensões extremas.
Plano de Trabalhos - Semestre 1
Plano genérico que será adaptado na fase de preparação de acordo com os objectivos definidos para a dissertação:
Fase Preparação:
Reunião de Arranque /Kickoff (data a definir)
Clarificação de objectivos, definição de âmbito e identificação de principais outputs (alinhados com os objectivos da Dissertação)
Fase Concepção:
Documentação de Requisitos: 2 semanas (S1 e S2);
Análise Funcional e Desenho Técnico: 3 semanas (S3, S4 e S5);
Fase Desenvolvimento:
Construção de módulo aquisição dados (S6, S7);
Construção do módulo de classificação e armazenamento de dados - (S6, S7, S8, S9, S10);
Construção de módulo de apresentação de métricas sobre a informação recolhida (S9, S10);
Fase Testes:
Testes Integrados e Aceitação: 3 semanas (S11,S12 e S13).
Plano de Trabalhos - Semestre 2
Plano genérico que será adaptado na fase de preparação de acordo com os objectivos definidos para a dissertação:
Fase Preparação:
Reunião de Arranque /Kickoff (data a definir)
Clarificação de objectivos, definição de âmbito e identificação de principais outputs (alinhados com os objectivos da Dissertação)
Fase Concepção:
Documentação de Requisitos: 2 semanas (S1 e S2);
Análise Funcional e Desenho Técnico: 3 semanas (S3, S4 e S5);
Fase Desenvolvimento:
Construção de módulo aquisição dados (S6, S7);
Construção do módulo de classificação e armazenamento de dados - (S6, S7, S8, S9, S10);
Construção de módulo de apresentação de métricas sobre a informação recolhida (S9, S10);
Fase Testes:
Testes Integrados e Aceitação: 3 semanas (S11,S12 e S13).
Condições
Serão atribuídas ao aluno condições idênticas às de um profissional Deloitte, ou seja, computador pessoal, acesso à internet, espaço de trabalho no escritório, etc.
Orientador
Hélio Filipe Coelho de Almeida
halmeida@deloitte.pt 📩