Titulo Estágio
Análise Preditiva para Séries Temporais do Produto Pulse
Área Tecnológica
Reconhecimento de Padrões
Local do Estágio
FeedZai -- Instituto Pedro Nunes (IPN)
Enquadramento
A empresa FeedZai S.A. possui um produto de processamento em tempo-real chamado Pulse(TM). [http://www.feedzai.com/pages/products]
O Pulse é um sistema processamento de dados em tempo real capaz de analisar grandes volumes de informação, fornecida sobre a forma de eventos, produzindo indicadores (Key-Performance-Indicators) em tempo real. Estes permitem aos decisores operacionais de um negocio ter uma visão instantânea de acontecimentos que podem afectar de forma positiva ou negativa a sua organização, reagindo de forma proactiva e correta.
Uma das componentes extremamente importantes do produto é o módulo de baselines. Este módulo permite comparar os valores atuais que estão a ser monitorizados contra valores esperados. Na verdade, tal corresponde a analisar uma série temporal de valores (o "tempo real"), contra uma ou mais séries de valores que estão a ser dinamicamente previstas. Caso o valor atual saia das bandas espectáveis, são desencadeados alarmes ou atuação.
Neste momento o módulo de baselines permite realizar um conjunto de operações simples, com base em dados históricos. Por exemplo, é possível dizer coisas como: "quero comparar o valor atual para este indicador, neste momento, com a média das últimas 4 semanas do mesmo indicador, a esta hora do dia, mais ou menos 2 desvios padrões" ou "comprar o valor atual contra o valor do último Natal, a esta hora do dia, mais 20%".
A FeedZai pretende incorporar no seu módulo de baselines métodos preditivos mais sofisticados, que possam beneficiar os utilizadores do produto. Em particular, métodos como o Holt-Winters, ARMA, entre outros, são de especial interesse.
Objetivo
Este estágio tem três objectivos principais:
1. Realizar um estado da arte sobre métodos preditivos de séries temporais, que possam ser incorporados no produto Pulse.
2. Selecionar e experimentar um subconjunto desses métodos, sendo a sua eficácia testada usando data-sets reais, fornecidos pelos nossos clientes.
3. Incorporar os métodos que obtenham bons resultados no módulo de baselines do produto.
No mínimo espera-se que 3 métodos sejam testados com data-sets reais, sendo os mesmos implementados no âmbito do estágio. É espectável que os datasets usados sejam das áreas da Banca (transações bancárias), Energia (consumos energéticos) e Telecomunicações (chamadas telefónicas).
O candidato deverá ter bons conhecimentos de matemática.
Plano de Trabalhos - Semestre 1
Preparação (2 meses):
Integração na área de trabalho e levantamento do estado da arte relativamente a Análise de Séries Temporais e métodos Analíticos Preditivos.
Espera-se também a familiarização com o produto Pulse da FeedZai e a forma como o mesmo funciona.
Durante esta fase espera-se que sejam escritos dois capítulos
da dissertação: (1) Introdução; (2) Estado-da-Arte.
Desenvolvimento Iterativo (2 meses): Será adoptada uma abordagem
iterativa de desenvolvimento, baseada em Scrum, em que em cada ciclo de desenvolvimento (duas a três semanas) serão definidas experiências ou funcionalidades a implementar, assim como procedimentos de avaliação. Existirão reuniões semanais de acompanhamento do trabalho. No primeiro semestre pretende-se implementar pelo menos duas iterações.
Durante o primeiro semestre espera-se testar um conjunto destes algoritmos, testar a sua eficácia com os datasets e selecionar os que serão efetivamente integrados no produto.
Plano de Trabalhos - Semestre 2
Desenvolvimento Iterativo (4 meses): Continuação do desenvolvimento iterativo do projeto, usando uma metodologia iterativa de desenvolvimento. Durante esta fase espera-se que o aluno implemente os algoritmos selecionados no módulo de baselines do produto.
Conclusão (1 mês): Esta fase será dedicada à escrita dos restantes capítulos da dissertação.
Condições
Estágio Remunerado (durante a totalidade dos semestres).
Observações
Aceitação do estagiário sujeita a entrevista.
Orientador
Rafael Marmelo
rafael.marmelo@feedzai.com 📩