Titulo Estágio
Applying machine learning on racing telemetry for driver identification
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
Laboratórios do Grupo de Computação Adaptativa do CISUC
Enquadramento
O mundo de racing esports –- competicoes de desportos motorizados online – , ainda esta a emergir, bem como todos os elementos que compoem este tipo de competicoes feito online. A utilizacao atual dos dados de telemetria e’ baseada no que e’ feito no mundo real, ainda nao aperfeicoada para utilizar as vantagens inerentes ao novo formato. Por exemplo, os dados serem normalmente analisados de uma forma individual ou comparativa entre duas amostras, em detrimento de uma analise mais agregada a uma grande quantidade de dados.
Uma das oportunidades relaciona-se com a identificao do piloto a conduzir, de forma a confirmar que a pessoa e’ quem e’ suposto ser, e nao outra ou mesmo nao humana.
Este estágio enfoca-se na resolucao deste problema, enquadrando-se para isso na aplicação de de algoritmos de machine learning no desenvolvimento de modelos de identificacao dos pilotos com base na sua telemetria.
Objetivo
O principal objetivo deste projecto consiste no desenvolvimento de modelos de identificacao dos pilotos virtuais com base em dados de telemetria do software de simulacao de corridas rFactor 2. Para tal, poderao serao usadas bases de dados com mais de uma centena de canais de informacao de telemetria, com registos de varios pilotos diferentes. O resultado do modelo deve ser claro na identificacao do piloto.
Os principais desafios cientificos sao: i) identificacao das caracteristicas chave que melhor identificam um piloto e comportamento nao humano; ii) identificacao da estrutura e algoritmo correcto de machine learning a implementar;
Plano de Trabalhos - Semestre 1
1. Levantamento des trabalhos de investigacao de outras Universidades
Resultados: relatorio com sumario de outros trabalhos potencialmente relacionados
2. Seleccao das caracteristicas chave para analisar e identificar os pilotos
Resultados esperados: identificacao dos canais e padroes a serem usados de forma conjunta para a identificacao dos pilotos
Serao facilitadas varias hipoteses de trabalho que deverao ser complementadas com tecnicas de data mining.
3. Escrita de relatorio intermedio do 1o semestre, com resultados e justificativos para os mesmos
Plano de Trabalhos - Semestre 2
1. Definicao e implementacao de algoritmo de machine learning para identificacao do piloto, com base nas caracteristicas chaves seleccionadas
Resultados esperados: relatório com definicao do algoritmo de machine learning utililizado e programa escrito em python para treino, teste de treino, e utilizacao de identificacao de um piloto com base em dados de telemetria.
2. Melhoramento do algoritmo com deteccoes de padroes nao humanos (telemetry outliers / funcionalidade anti-cheating)
Resultados esperados: relatório com definicao do algoritmo de machine learning utilizado e programa escrito em python para treino, teste de treino, e utilizacao de identificacao de "comportamento estranho". Algoritmo devera detectar padroes estranhos (e.g., tempos de reaccao de inputs, etc)
3. Escrita da tese
Condições
O trabalho decorrerá nos Laboratórios do Grupo de Computação Adaptativa do CISUC, no DEI.
Observações
As bases de dados com a informacao estao em Apache Cassandra.
Os algoritmos devem ser implementados em Python, com ferramentas adicionais a discutir em conjunto.
Este trabalho tem um conteúdo de investigação inovador relevante para publicacoes cientificas, sendo de elevado interesse a comunidade de racing esports.
Orientador
Ricardo Rodrigues Morais Diz
Ricardo@fidgrove.com 📩