Propostas Submetidas

DEI - FCTUC
Gerado a 2024-04-24 00:43:50 (Europe/Lisbon).
Voltar

Titulo Estágio

Redução de dimensionalidade em Big Data

Áreas de especialidade

Sistemas Inteligentes

Sistemas de Informação

Local do Estágio

DEI - AmILab

Enquadramento

Com o aumento demográfico em áreas urbanas tornou-se relevante o estudo da mobilidade. Para o efeito, estudam-se diferentes fontes de dados, com enfoque em dados não per intrusivos e que garantam o anonimado dos cidadãos. Entre as fontes, os dados de comunicações móveis (Call Detail Records e Sighting Data) são relevantes para a análise dos movimentos pendulares nas cidades. O seu estudo permite identificar locais relevantes interações entre cidadãos ou principais rotinas (Rodrigues, Veloso, Alves, Ferreira, & Bento, 2022), (Ferreira, Alves, Veloso, & Bento, 2022), (Heine, et al., 2021).

As comunicações móveis produzem informação pormenorizada, registando as interações entre os equipamentos móveis e as antenas, seja por ação direta dos utilizadores (CDR) ou sinalização periódica e automática do equipamento (Sighting Data). Estes datasets podem apresentar uma elevada dimensão (Big Data), de acordo com a janela temporal armazenada (Rehman, et al., 2016), o que levanta desafios ao processamento e análise dos dados.

Torna-se assim importante reduzir a dimensionalidade destas bases de dados para um tamanho que permita o seu processamento por algoritmos de machine learning em tempo útil, sem perda de informação. Os métodos tradicionais de redução de dados em Big Data incluem técnicas baseadas em teoria da rede, compressão, redução da redundância ou redução das dimensionalidades (Rehman, et al., 2016), (Si, et al., 2022).

REFERÊNCIAS
Ferreira, G., Alves, A., Veloso, M., & Bento, C. (2022). Identification and Classification of Routine Locations Using. ISPR Internation Journal of Geo-Information.
Heine, C., Marquez, C., Santi, P., Sundberg, M., Nordfors, M., & Ratti, C. (2021). Analysis of mobility homophily in Stockholm based on social network data. PLoS ONE.
Rehman, M., Liew, C. S., Abbas, A., Jayaraman, P. P., Wah, T. Y., & Khan, S. (2016). Big Data Reduction Methods: A Survey. Data Science and Engineering, 265–284.
Rodrigues, C., Veloso, M., Alves, A., Ferreira, G., & Bento, C. (2022). Using Mobile Phone Data To Extract Users’. Transactions on GIS.
Si, J., Yang, J., Liu, Z., Liu, M., Tu, B., Dai, S., & Chen, X. (2022). A Lossless Compression Method for CDR Trajectory Data. International Conference on Big Data Analysis. IEEE.

Objetivo

Este estágio tem como objetivo analisar a estrutura dos dados produzidos pelas comunicações móveis, estudar técnicas de redução de dados e propor um procedimento que permita a redução da dimensionalidade deste tipo de dados específico. Para o desenvolvimento do trabalho será disponibilizado um dataset de grande dimensão de comunicações móveis.

REFERÊNCIAS
Ferreira, G., Alves, A., Veloso, M., & Bento, C. (2022). Identification and Classification of Routine Locations Using. ISPR Internation Journal of Geo-Information.
Heine, C., Marquez, C., Santi, P., Sundberg, M., Nordfors, M., & Ratti, C. (2021). Analysis of mobility homophily in Stockholm based on social network data. PLoS ONE.
Rehman, M., Liew, C. S., Abbas, A., Jayaraman, P. P., Wah, T. Y., & Khan, S. (2016). Big Data Reduction Methods: A Survey. Data Science and Engineering, 265–284.
Rodrigues, C., Veloso, M., Alves, A., Ferreira, G., & Bento, C. (2022). Using Mobile Phone Data To Extract Users’. Transactions on GIS.
Si, J., Yang, J., Liu, Z., Liu, M., Tu, B., Dai, S., & Chen, X. (2022). A Lossless Compression Method for CDR Trajectory Data. International Conference on Big Data Analysis. IEEE.

Plano de Trabalhos - Semestre 1

T1 – Estudo do Estado da Arte
T2 – Análise do Dataset
T3A – Implementação e teste inicial de algoritmos de redução de dados

Entregáveis:
R1.1: Relatório do Estado da Arte
R2.1: Descrição do dataset
R3.1: Definição do procedimento de redução de dados

Plano de Trabalhos - Semestre 2

T3B – Implementação e teste de algoritmos de redução de dados
T4 – Otimização do procedimento de redução de dados
T5 – Documentação
T6 – Escrita de um artigo científico

Entregáveis:
R3.1: Definição do procedimento de redução de dados (nova versão)
R4.1: Teste e otimização do procedimento de redução de dados
R5.1: Artigo Científico
R6.1: Relatório de Projeto

Condições

LOCAL DE TRABALHO
Via Zoom por videoconferência e posteriormente de forma presencial DEI/CISUC
METODOLOGIA
Organização de um Dossier de Projeto através de uma pasta partilhada, e reuniões semanais.

ORIENTAÇÃO
DEI-CISUC:
Carlos Lisboa Bento (bento@dei.uc.pt)
Professor Associado com Agregação (UC)
CISUC:
Marco António Morais Veloso (marco.veloso@estgoh.ipc.pt)
Professor Adjunto (IPC)

BOLSA
O candidato selecionada concorre automaticamente a uma bolsa de Licenciado 6 meses (remuneração ~760€/mensais)

Observações

BOLSA
O candidato selecionada concorre automaticamente a uma bolsa de Licenciado 6 meses (remuneração ~760€/mensais)

Orientador

Carlos L Bento e Marco Veloso
bento@dei.ic.pt 📩