Titulo Estágio
LaNDLESS: integração de Linked Data com Linked Services
Área Tecnológica
Sistemas de Informação
Local do Estágio
DEI-FCTUC
Enquadramento
A infraestrutura Linked Data (LD) [1] está a gerar um enorme interesse e aceitação por parte de investigadores e pela indústria. Tomando a forma de um próximo avanço lógico, os Linked Services (LS) também começaram recentemente a dar os seus primeiros passos. Ambos os termos referem-se a dados e a serviços publicamente disponíveis na World Wide Web representados usando linguagens ontológicas como o RDF e o OWL. Estas linguagens são definidas por normas do World Wide Web Consortium (W3C) para a partilha de metadados e para a integração de informação [7].
Historicamente, o conhecimento empresarial que descreve dados e serviços esteve sempre fechado em ‘ilhas’ de informação privadas e protegidas por ‘firewalls’. O Linked Data e os Linked Services são iniciativas recentes que usam os avanços científicos da Web Semântica para permitir às organizações fornecer um acesso remoto a dados e serviços internos a entidades externas. Por exemplo, os governos dos EUA e Reino Unido já tornam a sua legislação disponível aos cidadãos de forma aberta e transparente através de linguagens semânticas (por exemplo gov.track.us e legislation.gov.uk). O conjunto de todos os dados disponibilizados mundialmente é chamado de Linked Data cloud. Os Linked Services, tal como o Linked Data, seguem princípios semelhantes que permitem descrever também serviços de uma forma aberta, exposta e livremente acessível. O este conjunto chama-se Linked Services cloud. O Linked Data já conta com mais de 30 bilhões de triplos RDF e os Linked Serviços (cf [10]) estão a demonstrar rapidamente o seu potencial para um crescimento exponencial.
No entanto, de forma isolada o valor das clouds de Linked Data e Linked Services (LDS) é reduzido. Hoje em dia é quase impossível usar a cloud LDS de forma totalmente automatizada. Um dos principais obstáculos é a falta de integração semântica entre os dados e os serviços, e a heterogeneidade semântica resultante [6]. Dado que um serviço é composto por metas, entradas, processos, estruturas de custos, recursos, etc, é natural associar os elementos dos serviços presentes da Linked Service cloud aos dados presentes na Linked Data cloud.
Por exemplo, um dos serviços financeiros da Merrill Lynch administra um fundo do tipo Hedge. Assim, o serviço pode ser descrito usando linguagens da Web Semântica da seguinte forma freebase://industria/Serviços_Financeiros, tendo como entrada um ‘Hedge Fund’ descrito por dbpedia:Hedge_fund que pertence à Linked Data cloud. Por outras palavras, os dados referenciados por serviços da Linked Services, tais como objetivos, entradas e saídas de dados, pode, de fato, ser representado por elementos de dados presentes na Linked Data cloud. Sendo a economia de serviços globalmente interligada, a capacidade de realizar perguntas sobre as ligações entre serviços e dados pode fornecer informação importante sobre a forma como a nossa economia se organiza globalmente (cf [27]).
Objetivo
Neste projeto concentrarmo-nos na tarefa particularmente interessante de efetuar perguntas (i.e. queries) a LDS cloud, ou seja, na obtenção de respostas para questões que exigem o acesso e a combinação de informação vinda de diferentes partes da LDS cloud. Iremos beneficiar da experiência adquirida na área de Linked Data no trabalho com o nosso parceiro de investigação dos EUA no projeto NSF III EAGER (Scalable Expressiva Consultando mais integrado relacionado Open Data; NFS ID 1143717). Uma conclusão do projeto com sucesso terá um impacto que extravasa a integração semântica. Vai para além da integração de dados, considerando também a integração de serviços. A materialização do nosso projeto será visível em três níveis:
1) Um conjunto de serviço será construído e fará parte da Linked Service cloud. Esta tarefa é fundamental para apoiar o trabalho futuro neste domínio e para testar o conceito integrado de LDS;
2) Integração da Linked Data cloud e da Linked Service cloud através da criação de uma ontologia de nível superior que servirá também de abstração para facilitar a consulta da LDS e
3) Queries de gestão de perguntas que quebram perguntas em sub-perguntas que são posteriormente respondidas individualmente pelas Linked Data e pela Linked Services clouds.
Do lado dos serviços, construiremos sobre a linguagem USDL que desenvolvemos no projeto TEXO/THESEUS (financiado pelo BMBF na Alemanha). Os resultados deste projeto não se limitam a consulta da LDS cloud, mas têm o potencial de melhorar as aplicações nas quais a heterogeneidade semântica tem que ser resolvida (por exemplo, na integração de informação e na procura semântica). O projeto pode culminar numa World Wide Web onde as capacidades de processamento de informação e de serviços ultrapassarão as capacidades atuais de uma forma qualitativa. Assim, o projeto contribui para a próxima transformação significativa da nossa sociedade de serviços (cf [8]).
Plano de Trabalhos - Semestre 1
(a) Use-case que demonstre os benefícios da integração do LD com o LS (Setembro de 2012)
(b) Especificação de requisitos e estudo das tecnologias usadas no projecto (Outubro a Novembro de 2011). Análise e definição dos requisitos do sistema a desenvolver.
(c) Arquitectura e design (Dezembro de 2012 a Janeiro de 2013) – definição do design detalhado arquitectura do sistema a implementar até final do Estágio. Prototipagem rápida para ilustrar e ajudar a definir os requisitos funcionais assim como gerar a primeira versão do sistema.
(d) Escrita e defesa do relatório intermédio de estágio (Dezembro de 2012 e Janeiro de 2013).
(e) Primeiro protótipo (Fevereiro de 2013). Descrição da primeira versão da abordagem/queries/use-case com previsão da integração do LD com o LS.
Plano de Trabalhos - Semestre 2
(f) Construção (Fevereiro a Maio de 2013) – Codificação dos módulos definidos. 2ª versão do use-case incluindo integração melhorada do LD com o LS
(g) Testes (Abril a Junho de 2013) – definição e execução dos casos de teste dos diversos módulos.
(h) Documentação (a decorrer ao longo de todo o estágio) – integração e revisão da documentação produzida em cada fase do estágio no conjunto de documentos finais que descrevem o trabalho efectuado tecnicamente e na perspectiva do utilizador.
(i) Escrita e defesa do relatório de estágio (Maio a Julho de 2013). Entrega da versão final do use-case e documentação técnica.
Condições
Este trabalho será realizado no DEI/Universidade de Coimbra. Será disponibilizado um local de trabalho apropriado e todos os recursos computacionais necessários. O estágio poderá ser remunerado se este projecto for financiado pela Fundação para a Ciência e Tecnologia ou pela Fundação Luso-Americana para o Desenvolvimento. No caso de o projecto ser financiado, esta previsto o aluno fazer um estágio no Knoesis Research Center (http://knoesis.wright.edu/) nos Estados Unidos.
Observações
NA
Orientador
Jorge Cardoso
jcardoso@dei.uc.pt 📩