Titulo Estágio
KUSCO@TICE.Mobilidade: Enriquecimento Semântico de Lugares e Eventos
Área Tecnológica
Sistemas Móvies e Ubíquos
Local do Estágio
DEI
Enquadramento
O KUSCO é um projecto de investigação actualmente implementado para a língua Inglesa que através de Web Mining associa tags semânticas a lugares, especificamente Pontos de Interesse (POIs) que representem não só pontos turísticos mas também empresas e serviços geo-referenciados. Devido à falta de conteúdos disponibilizados actualmente em inglês para POIs e Eventos em território nacional e o grande interesse por parte de diversos projectos para a utilização de mais informação estruturada sobre estes lugares e acontecimentos (e.g. CityMotion, iTeam, Aida, CROWDS, etc.), prentende-se implementar um sistema similar ao KUSCO para a língua Portuguesa.
O projecto “TICE.Mobilidade – Sistema de Mobilidade Centrado no Utilizador” visa disponibilizar, através das TIC (Tecnologias de Informação e Comunicação), uma plataforma digital facilitadora de serviços de mobilidade centrados no utilizador, que combina mobilidade, optimização energética e gestão de espaços urbanos. O projecto é composto por vários PPS's (Produtos, Processos ou Serviços) fornecedores de serviços capazes de tornar mais eficiente a rede de mobilidade urbana, permitindo ainda a transferência de tecnologia e conhecimento às empresas que participam no projecto.
Este estágio insere-se num projecto denominado "PPS2 - SEMA - Selecção de informação baseada em mecanismos de atenção selectiva, enriquecimento semântico e interoperabilidade semântica" que integra o TICE.Mobilidade financiado pelo QREN, onde será desenvolvida uma plataforma transversal de informação semântica associada a lugares e eventos que disponibilizará serviços de acesso a outros projectos. O objectivo deste estágio é especificar, desenvolver, testar e integrar o módulo de enriquecimento semântico no projecto SEMA.
Objetivo
Este projecto tem como objectivo desenvolver um sistema de Enriquecimento Semântico de Lugares para o Português, que permita ainda classificar áreas geográficas de acordo com a incidência dos serviços oferecidos. O projecto focar-se-á inicialmente na extracção e integração de POIs e eventos de fontes on-line. Esta informação deverá ser disponibilizada através de uma Ontologia que permita a partilha de informação estruturada através de um serviço que poderá ser utilizado por outros projectos da Plataforma TICE.Mobilidade. Para cada POI e evento serão associadas tags extraídas de fontes de informação genéricas (e.g. Wikipedia) ou especializadas (e.g. Página Oficial de um determinado evento ou instituição ). E finalmente, a relevância das tags obtidas será calculada através de métodos estatísticos que tenham em conta também o factor de diferenciação que cada tag representa. Serão utilizadas técnicas de Processamento da Língua Natural, assim como de Aprendizagem, como é o caso dos CRF, para a classificação de cada termo presente nas páginas associadas a lugares ou eventos como uma tag.
Plano de Trabalhos - Semestre 1
O planeamento provisório (primeiro semestre) é o seguinte:
- 19 de Setembro - Identificação e especificação dos dados a extrair das fontes de enriquecimento semântico. (0.5 meses)
- 19 de Outubro - Estudo do estado da arte. Familiarização com o contexto específico do projecto: arquitectura da plataforma TICE, tecnologias utilizadas, estudo de casos de uso e Ontologia pré-estabelecida para interoperabilidade semântica. (1 mês)
- 18 de Novembro - Análise de requisitos do módulo de enriquecimento semântico (1 mês)
- 16 de Dezembro - Relatório intermédio (1 mês)
Plano de Trabalhos - Semestre 2
Para o segundo semestre, espera-se o seguinte conjunto de tarefas:
- 15 de Fevereiro - Extracção intensiva de informação da fontes de enriquecimento semântico (1 mês)
- 30 de Março - Desenvolvimento do módulo de enriquecimento semântico (1.5 meses)
- 13 de Abril - Integração do módulo de enriquecimento semântico no SEMA. (0.5 meses)
- 27 de Abril - Testes de integração. (0.5 meses)
- 1 de Junho - Entrega da dissertação. (1 mês)
Condições
Para o segundo semestre, espera-se o seguinte conjunto de tarefas:
- 15 de Fevereiro - Extracção intensiva de informação da fontes de enriquecimento semântico (1 mês)
- 30 de Março - Desenvolvimento do módulo de enriquecimento semântico (1.5 meses)
- 13 de Abril - Integração do módulo de enriquecimento semântico no SEMA. (0.5 meses)
- 27 de Abril - Testes de integração. (0.5 meses)
- 1 de Junho - Entrega da dissertação. (1 mês)
Observações
Este estágio é remunerado.
Orientador
Francisco Câmara Pereira e Ana Alves
camara@dei.uc.pt 📩