Propostas atribuídas ano letico 2025/2026

DEI - FCTUC
Gerado a 2025-08-31 18:11:48 (Europe/Lisbon).
Voltar

Titulo Estágio

Reinforcement Learning para Gestão Inteligente de Alarmes em Empresas de Telecomunicações de Grande Escala

Área Tecnológica

Inteligência Artificial e Machine Learning

Local do Estágio

PT INOVAÇÃO

Enquadramento

As organizações empresariais têm feito esforços para que os processos de tomada de decisão sejam baseados em informação. Business Intelligence (BI) é um termo abrangente que inclui metodologias, arquitecturas, ferramentas, aplicativos e tecnologias para melhorar a gestão de tomada de decisão.

 

Muito recentemente, surgiu uma nova tendência no mercado chamado Adaptive Business Intelligence (ABI) e que a PT Inovação tem interesse em acompanhar. Além de transformar dados em conhecimentos, ABI também inclui o processo de tomada de decisão. Os sistemas de BI, tradicionalmente são compostos por elementos das bases de dados, armazéns de dados e data mining, enquanto que em ABI também englobam sistemas de previsão e optimização, a fim de aumentar a adaptabilidade. Com efeito, a adaptabilidade é um componente vital de qualquer sistema inteligente e é esperado que este tópico ganhe popularidade nos próximos anos. A finalidade em ABI é a utilização de sistemas informáticos que se possam adaptar às mudanças no ambiente, resolver problemas complexos do mundo real com vários objectivos, de modo a ajudarem gestores empresariais a tomar melhores decisões, aumentando a eficiência, produtividade e competitividade.

 

Durante as últimas décadas, com a massificação do acesso à Internet, o crescimento das redes móveis, etc., tem havido um forte aumento dos requisitos associados às redes de telecomunicações. Para apoiar este crescimento, as empresas de telecomunicações estão a investir em novas tecnologias para melhorar os seus serviços. Em particular, a monitorização em tempo real das infra-estruturas e serviços é uma questão-chave dentro de qualquer empresa de telecomunicações. Por um lado, a qualidade do serviço tem de ser assegurada por um diagnóstico atempado com avaliação de impacto no serviço  e recuperação. Isto é particularmente necessário para cumprir os Service Level Agreements (SLAs) que são estabelecidos entre o prestador de serviços e seus clientes. Por outro lado, as tarefas operacionais devem ser simplificados para garantir a redução dos custos operacionais (OPEX).

 

Assim, há uma grande variedade de ferramentas de software e aplicações que foram desenvolvidas para resolver este problema e a maioria destes instrumentos exige uma intervenção humana para a acção correctiva. Em particular, várias destas soluções incorporam mecanismos de correlação, que é o componente “inteligente” da plataforma de gestão. O objectivo é explorar os dados recolhidos através da monitorização de subsistemas, bem como das notificações enviadas espontaneamente pelas entidades geridas.

 

No entanto, como as redes se tornam mais vastas, com mais dependências intrincadas e dinâmicas, novos desafios se colocam a estes mecanismos de correlação, tais como:

 (i) Em grandes empresas de telecomunicações, as redes são muito heterogéneas e as regras de correlação de eventos assentam fortemente na informação fornecida pelo vendedor, que nem sempre estão disponíveis. Assim, a eficácia destas soluções depende fortemente da relação comercial com o vendedor dos dispositivos.

(ii) A maioria dos paradigmas para regras de correlação, incluindo rule-based reasoning, probabilistic reasoning, model-based reasoning e case-based, são pré-configurados e não aprendem com a experiência, assim, podem não responder correctamente a situações que não foram pré-codificadas.

(iii) "Manter os utilizadores no loop", ou seja, manter os utilizadores informados das alterações na disponibilidade de serviços nem sempre é feito correctamente. Portanto, é difícil avaliar a eficácia dos resultados de reporting.

 

Idealmente, um sistema de gestão inteligente de alarmes deve ser capaz de interpretar a enorme quantidade de eventos recebidos, reduzindo a intervenção humana. No entanto, projectar e manter um sistema com estas características não é um processo trivial.

Objetivo

Actualmente são armazenadas e processadas quantidades massivas de dados. Todos estes dados possuem informações valiosas, tais como tendências e padrões, que estão já a ser utilizadas para melhorar a tomada de decisão e optimizar as hipóteses de sucesso recorrendo a técnicas de data mining.

Padrões de alarmes estão a ser descobertos automaticamente, a partir de algoritmos de associação (ex. APIORI) que permitem a geração automática de regras de correlação, em oposição aos sistemas tradicionais, onde estas são pré-definidas. O objectivo final é a construção de uma ferramenta de apoio à decisão para grandes operadores de telecomunicações.

Propõe-se para este estágio o desenvolvimento de uma arquitectura para gestão inteligente de alarmes. A abordagem a seguir passa por combinar os resultados anteriores com dados de outros sistemas de suporte às operações(por exemplo, trouble ticketing ou QoS) como fonte de feedback. Em concreto, o componente a implementar é um sistema de reinforcement learning, que irá orientar a selecção de regras de associação.

O objectivo desta arquitectura é atingir um sistema adaptável e auto-sustentável.

Assim, a nossa abordagem poderá ter um grande impacto no negócio, uma vez que potencialmente vai permitir recuperar montantes consideráveis de receitas perdidas. As tarefas de supervisão serão facilitadas, conseguindo identificar as causas das anomalias mais rapidamente e com maior precisão, reduzindo custos de manutenção. Além disso, ao proporcionar um melhor serviço, espera-se aumentar a satisfação dos clientes, diminuindo o risco de churning.

Plano de Trabalhos - Semestre 1

·         Aprender os conceitos base de ABI, incluindo características de problemas complexos, BI e ABI, data mining, optimização e adaptabilidade;

·         Dominar o estado da arte de métodos e modelos (ex. Árvores de Decisão, Redes Neuronais, Algoritmos Evolucionários), metodologias (ex. CRISP-DM), e exploração de ferramentas (ex. R, WEKA, SAS, Evolution Machine, SCS-C);

·         Dominar o estado da arte de Reinforcement Learning, principais algoritmos e casos de aplicação com sucesso;

Plano de Trabalhos - Semestre 2

·         Implementar um sistema de Reinforcement Learning para estabelecimento de política de suporte à manutenção de regras de correlação e root cause analysis.

Condições

bolsa remunerada.
selecção : entrevista

Observações

Referências bibliográficas:

1.       Gupta, A., Network Management: Current Trends and Future Perspectives. Journal of Network and Systems Management, 14:483-491, 2006.

2.       Martin, J.P., Flatin, M. Jakobson, G. Lewis, L., Event Correlation in Integrated Management: Lessons Learned and Outlook, Springer, 2007.

3.         Z. Michalewicz, M. Schmidt, M. Michalewicz and C. Chiriac, Adaptive Business Intelligence, Springer-Verlag, Leipzig, Germany, 2007.

Orientador

Raúl Silva Costa
raul-s-costa@ptinovacao.pt 📩