Titulo Estágio
Desenvolvimento de Sistemas de Recomendação Inteligentes e Personalização Avançada para Plataforma de Análise Desportiva
Local do Estágio
Instituto Pedro Nunes, Coimbra (Laboratório de Informática e Sistemas)
Enquadramento
O IPN está a participar no desenvolvimento de uma plataforma de software inovadora, que utiliza inteligência artificial para transformar os processos de deteção e análise de talento no setor desportivo, particularmente no futebol. Esta plataforma visa democratizar o acesso a ferramentas de scouting avançadas e automatizar análises complexas. Para enriquecer a experiência do utilizador e a eficácia da plataforma, existe a necessidade de desenvolver sistemas de recomendação sofisticados e mecanismos de personalização dinâmica.
O projeto prevê a integração ou utilização das seguintes fontes de dados e datasets:
- Wyscout – https://www.hudl.com/en_gb/products/wyscout - Plataforma comercial cujos endpoints expõem, em média, ≈ 2 000 jogos/semana, ≈ 4 000 000 de eventos de jogo por semana, > 400 métricas técnicas/tácticas/físicas e um histórico superior a 10 épocas. O repositório cobre > 750 000 jogadores distribuídos por ± 2 200 competições em todo o mundo.
- Transfermarkt – https://www.transfermarkt.com/ - Base de dados pública com ≈ 840 000 jogadores, ≈ 75 000 clubes e ≈ 500 competições. Fornece histórico completo de transferências, tempos de contrato, valores de mercado actualizados e estatísticas de jogo, tornando-se imprescindível para modelar tendência de valorização e movimentações de mercado.
- Fontes contextuais em tempo-real - Notícias (APIs de fornecedores especializados, feeds RSS), redes sociais e registos de alterações técnicas (entradas/saídas de treinadores, lesões, etc.).
- Dados fisiológicos e de carga externa - Para os modelos de prevenção de lesões, serão integradas séries temporais de GPS/wearables (distância, acelerações, impacto), parâmetros fisiológicos (FC, HRV), diários de bem-estar, históricos clínicos e calendário competitivo, permitindo prever fadiga e risco de lesão.
- Datasets públicos de validação - Conjuntos de eventos espaço-temporais como o Public Soccer Match Event Dataset de Pappalardo et al. serão utilizados para benchmarking inicial dos modelos antes da ingestão dos dados proprietários.
O foco será na criação de funcionalidades que permitam oferecer aos utilizadores – como clubes, agentes e analistas – informações e interfaces ajustadas aos seus perfis e necessidades específicas, aprendendo continuamente com a sua interação.
Objetivo
O objetivo principal deste estágio é investigar, desenvolver e integrar sistemas de recomendação e funcionalidades de personalização avançada numa plataforma de análise de dados desportivos. O(A) estagiário(a) deverá:
- Desenvolver um sistema de recomendação para jogadores, equipas e competições, que se ajuste dinamicamente aos interesses e necessidades de cada utilizador.
- Criar feeds personalizados com informações relevantes, como alertas sobre atletas promissores, análises de desempenho ou oportunidades de mercado, gerados com base na análise contínua de dados e no perfil do utilizador.
- Explorar e implementar técnicas de filtragem colaborativa, baseada em conteúdo e híbridas, assim como algoritmos de aprendizagem automática para otimizar as recomendações.
- Implementar mecanismos de personalização profunda, permitindo que a plataforma aprenda continuamente com as interações do utilizador (feedback explícito e implícito) e ajuste as suas funcionalidades e recomendações de forma proativa, incluindo a adaptação de interfaces e a antecipação de necessidades de informação.
- Considerar a aplicação de técnicas de MLOps para a evolução e manutenção eficientes dos modelos desenvolvidos.
Plano de Trabalhos - Semestre 1
Durante o 1º semestre, o projeto será composto pelas seguintes fases de desenvolvimento:
• F1 – Análise do estado da arte (25% do semestre): Investigação de abordagens atuais, técnicas e algoritmos para sistemas de recomendação, personalização de experiência de utilizador e aprendizagem contínua em plataformas interativas, com foco no domínio desportivo.
• F2 – Levantamento de requisitos (25% do semestre): Definição dos requisitos funcionais e não funcionais para os módulos de recomendação e personalização. Especificação de fontes de dados, modelos de utilizador e métricas de avaliação da relevância, satisfação e adaptação dos sistemas.
• F3 – Protótipo (50% do semestre): Desenvolvimento de protótipos dos algoritmos de recomendação (e.g., filtragem colaborativa, baseada em conteúdo) e dos mecanismos de personalização e aprendizagem contínua. Testes preliminares e validação de conceitos.
Plano de Trabalhos - Semestre 2
Durante o 2º semestre, o projeto será composto pelas seguintes fases de desenvolvimento:
• F4 – Implementação (70% do semestre): Desenvolvimento completo e integração dos sistemas de recomendação e personalização na plataforma principal. Implementação dos mecanismos de recolha e processamento de feedback do utilizador e dos ciclos de aprendizagem contínua dos modelos.
• F5 – Testes (20% do semestre): Realização de testes exaustivos para avaliar a eficácia das recomendações, a precisão da personalização, o desempenho dos modelos de aprendizagem e a robustez geral dos módulos desenvolvidos em ambiente simulado e real.
• F6 – Deploy e relatório de projeto (10% do semestre): Otimização final das soluções para ambiente de produção, elaboração do relatório final de estágio detalhando o trabalho desenvolvido, os resultados obtidos e a documentação técnica das funcionalidades implementadas.
Condições
Este trabalho será integrado num projeto de investigação cofinanciado, sendo que o aluno poderá candidatar-se a uma bolsa de investigação para licenciado no âmbito deste projeto, nos termos da legislação aplicável e regulamentos do IPN. O valor da bolsa é de 1040,98€, em linha com a tabela de bolsas de investigação da FCT.
Observações
Áreas de especialidade:
Inteligência Artificial
Aprendizagem Automática (Machine Learning)
Sistemas de Recomendação
Engenharia de Software
Análise de Dados
Orientador
Carlos Lopes
clopes@ipn.pt 📩