Titulo Estágio
2025/26_N23 Exploração e Implementação do Conceito de Table-Augmented Generation(TAG) para Consulta Inteligente de Bases de Dados com Analítica
Local do Estágio
Altice Labs
Enquadramento
O universo de dados de um operador de telecomunicações é particularmente desafiante devido ao elevado volume, velocidade e diversidade dedados gerados continuamente. Este ecossistema engloba desde dados raw, dados em tempo real, timeseries, até dados estatísticos ou eventos,cada um com requisitos específicos para armazenamento e processamento.
A interação com bases de dados através de consultas em linguagem natural tem sido um desafio persistente na área de Processamento deLinguagem Natural (PLN). Métodos tradicionais, como o Text2SQL, focam-se na tradução de perguntas em linguagem natural para consultas SQL,mas enfrentam limitações ao lidar com questões que requerem raciocínio complexo ou conhecimento adicional. A Geração Aumentada porTabelas (Table-Augmented Generation - TAG) surge como uma abordagem inovadora que integra modelos de linguagem com sistemas de basesde dados, permitindo uma compreensão mais profunda e respostas mais precisas às consultas dos utilizadores.
O objetivo deste estágio é explorar e configurar um ambiente real de laboratório, onde se possa analisar o funcionamento do TAG, definir os seusrequisitos de parametrização, integrar com bases de dados transacionais e analíticas e avaliar o seu impacto na gestão de dados no contexto doNOSSIS One, a solução OSS da Altice Labs.
Objetivo
Explorar o conceito de Table-Augmented Generation (TAG) e entender os seus mecanismos de funcionamento.
Implementar e parametrizar um cenário real de laboratório, configurando modelos de TAG com dados de telecomunicações.
Analisar as necessidades de engenharia de dados e integração do TAG com sistemas relacionais (PostgreSQL, Oracle) e analíticos(TimescaleDB, Snowflake).
Criar um protótipo funcional para validação do conceito e levantamento de requisitos técnicos para futura integração no NOSSIS One.
Avaliar o impacto e desempenho da solução, incluindo benchmarking e testes de escalabilidade.
Plano de Trabalhos - Semestre 1
1.Levantamento do estado da arte sobre Table-Augmented Generation (TAG) e suas aplicações.
2.
Configuração de um ambiente laboratorial para testar e validar o funcionamento do TAG com bases de dados reais.
3. Relatório Intermédio
Plano de Trabalhos - Semestre 2
4.
Desenvolvimento de um protótipo funcional, analisando os impactos do TAG na eficiência das consultas.
5.
Integração com sistemas OSS/BSS, estudando a viabilidade de implementação no NOSSIS One.
6.
Testes de desempenho e escalabilidade, avaliando requisitos para um uso produtivo da solução.
7.
Documentação técnica detalhada, incluindo requisitos para futura incorporação do TAG na Altice Labs.
8 Relatório Final
Condições
Integração no Programa GENIUS Investigação da Inova-Ria.
Entidade Promotora: Inova-Ria
Entidade de acolhimento: Altice Labs
Com possibilidade de integrar uma Bolsa de Investigação - Programa GENIUS - durante a realização do projeto de Dissertação - Integração numa equipa de I&D na Empresa Altice Labs .
Valor de bolsa de acordo com tabelas da FCT (ver pdf em (www.Inova-Ria.pt).
Período de realização de acordo com o enquadramento da Universidade.
• Horário: De acordo com enquadramento da Universidade
• Formato: (a combinar na entrevista)
• Meios: atribuição de um PC portátil e acessos à rede Interna da Altice Labs
• Kit de Acolhimento
• Onboarding nas equipas da Altice Labs, com atribuição de um tutor full-time
• Possibilidade de participar em todas as iniciativas de partilha de conhecimento ou de entretenimento levadas a cabo pela Altice Labs
• Possibilidade de entrada nos quadros da empresa
Os alunos interessados deverão enviar para genius@inova-ria.pt ao cc Dra Regina Maia Sacchetti (963618710).
• Curriculum Vitae;
• Disciplinas realizadas até ao momento com médias; simples documento eletrónico, que poderá obter no portal académico .
Processo de Seleção: Entrevista Inova-Ria - PROGRAMA GENIUS na qual fará parte o Orientador do projeto de forma a esclarecer a temática envolvida.
Observações
Aspetos Inovadores
Exploração prática e profunda do conceito TAG em um ambiente realista de telecomunicações.
Integração de machine learning com bases de dados, permitindo a otimização de queries dinâmicas.
Análise de viabilidade para futura incorporação da tecnologia TAG no NOSSIS One.
Estudo de impacto do TAG no desempenho, escalabilidade e usabilidade dos sistemas de analytics da Altice Labs.
Ferramentas a utilizar
Linguagens e Frameworks: Python, SQL, TensorFlow/PyTorch.
Modelos de IA: Large Language Models (LLMs) aplicados a consulta de bases de dados.
Bases de Dados: PostgreSQL, Oracle, TimescaleDB, Snowflake.
APIs e Integração: OpenAPI, REST.
Ambientes de Teste: Jupyter Notebook, Docker, Kubernetes.
Referências Bibliográficas
1.
"Table-Augmented Generation (TAG): A Unified Approach for Enhancing Natural Language Querying over Databases" (
MarkTechPost).
2.
"Unifying AI and Databases with TAG" (arxiv.org).
Orientador
Luis Alexandre da Silva Castro
luis-a-castro@alticelabs.com 📩