Propostas submetidas

DEI - FCTUC
Gerado a 2024-12-12 13:27:58 (Europe/Lisbon).
Voltar

Titulo Estágio

Exploração de técnicas de Análise de Dados e Machine Learning aplicados à Mobilidade

Áreas de especialidade

Sistemas Inteligentes

Sistemas de Informação

Local do Estágio

Ambient Intelligence Lab (AmILab)

Enquadramento

A mobilidade é, cada vez mais, influenciada por fatores que dificultam a circulação (congestionamento de tráfego, informação não atualizada, eventos, acidentes, supressão de vias, obras, entre outros). Os constrangimentos do dia-a-dia dos cidadãos (por exemplo, morar a vários quilómetros do local de trabalho, o deixar os filhos na escola, entre outros) e a falta de serviços integrados de mobilidade levam a que haja uma menor utilização dos transportes coletivos, a um aumento do trânsito nas áreas urbanas e, consequentemente, a um aumento do tráfego e congestionamentos, maior poluição e diminuição da eficiência energética.

É claro, neste momento, que ter mais informação atualizada, mais integração e uma melhor coordenação dos transportes é fulcral para uma melhor mobilidade, inclusiva, inteligente e ajustada às necessidades dos utentes. Considera-se que, a mobilidade do futuro terá que ter em conta diferentes fontes de dados, com diversos níveis de granularidade e frequência de atualização adequados. Por esse motivo, consideramos que um cenário de mobilidade urbana requer a integração de várias fontes de dados heterogéneas para fornecer informação acerca do trânsito, condições ambientais, sentimentos das pessoas e suas opiniões

As fontes de dados externas podem ser classificadas em quatro tipos principais: a) dados estacionários - descrevem os elementos estáticos que compõem o ambiente alvo. Inclui informação geográfica, infraestruturas de transportes, pontos de interesse e outra informação que possa ser relevante para perceber a localização dos componentes dentro do cenário. b) dados espaciais dinâmicos - contém informação acerca de um específico ponto no tempo. Inclui informação sobre o trânsito georreferenciado, estado do trânsito e notícias, existência de eventos, e todos os tipos de informação temporal útil para medir as condições de mobilidade. c) dados ambientais - apresenta informação acerca das condições do ambiente assim como previsões do estado do tempo que possam ser importantes para perceber a mobilidade dos agentes; d) dados de redes sociais - fornecem fluxos de dados úteis para extrair informação acerca de sentimentos e eventos imprevisíveis. 

Estes dados, principalmente os provenientes de fontes externas precisam também de ser tratados antes de serem armazenados. De forma resumida, as principais tarefas de tratamento de dados são: 1) limpeza de dados – preencher valores em falta, reduzir o ruído dos dados, identificar ou remover outliers e inconsistências; 2) integração de dados – estabelecimento de relação entre os dados das várias fontes; 3) transformação de dados – normalização e agregação; 4) redução de dados – obter representações menores em volume mas com o mesmo poder analítico; 5) Discretização de dados – técnicas de redução de dados com especial importância para dados numéricos. Após o tratamento, os dados podem ser usados para acesso ou para processamento. Dados derivados podem ser gerados através destes algoritmos ou mesmo de técnicas de machine learning. Estes dados podem ser armazenados no sistema para posterior consulta, análise e também para melhoria da performance de outros algoritmos de processamento. 

Objetivo

O objetivo desta dissertação é estudar e aplicar diferentes técnicas de Análise de Dados e Machine Learning a partir de diferentes fontes de dados de mobilidade a fim de auxiliar: a determinação de métricas de utilização de transportes coletivos, compreender as necessidades dos utentes e otimizar os serviços dos operadores e entidades reguladoras/coordenadoras da mobilidade. Dependendo dos resultados obtidos, deverão ser selecionadas as técnicas com melhor performance para serem implementadas como um serviço numa plataforma transversal de Mobilidade no âmbito de um projeto financiado pelo Sistemas de Incentivos à Investigação e Desenvolvimento Tecnológico (SI I&DT).

Este trabalho terá uma forte componente experimental, que deverá abranger: (i) estudo dos diferentes tipos de fontes de dados de Mobilidade disponíveis; (ii) estudo e exploração de técnicas de aprendizagem aplicadas à Mobilidade (e.g. análise de dados para extração de características, seleção de algoritmos de machine learning); (iii) seleção das técnicas com melhor performance (iv) desenvolvimento de um serviço que integre as técnicas anteriores e permita a resposta conjuntos de dados de Mobilidade; (v) integração do serviço numa plataforma transversal.

Plano de Trabalhos - Semestre 1

Levantamento do estado da arte de fontes de dados de Mobilidade disponíveis
Levantamento do estado da arte de técnicas de aprendizagem aplicada à mobilidade
Experimentação das técnicas de aprendizagem sobre os dados de Mobilidade disponíveis
Elaboração da proposta de dissertação

Plano de Trabalhos - Semestre 2

Seleção das técnicas de aprendizagem com melhor performance
Desenvolvimento de um serviço para aplicação das técnicas de aprendizagem
Integração serviço numa plataforma transversal
Experimentação e avaliação do serviço
Elaboração da dissertação
Escrita de artigo científico

Condições

O local de trabalho será o laboratório de investigação AmILab do grupo CMS do CISUC onde haverá um acompanhamento regular por parte dos orientadores.

Observações

Há a forte possibilidade de este trabalho ser integrado num projeto financiado pelo Sistemas de Incentivos à Investigação e Desenvolvimento Tecnológico (SI I&DT). e, nesse contexto, de ser remunerado através de uma bolsa de investigação para licenciado com a duração de, pelo menos, 6 meses.

Orientador

Carlos Lisboa Bento (co-orientação Ana Alves Oliveira)
bento@dei.uc.pt 📩