Titulo Estágio
Kusco@PT: Enriquecimento Semântico de Lugares
Área Tecnológica
Inteligência Artificial
Local do Estágio
DEI
Enquadramento
O Kusco é um projecto de investigação actualmente implementado para a língua Inglesa que através de Web Mining associa tags semânticas a lugares, especificamente Pontos de Interesse (POIs) que representem não só pontos turísticos mas também empresas e serviços georeferenciados [Alves et. Al, 2009]. Devido à falta de conteúdos disponibilizados actualmente em inglês para POIs em território nacional e o grande interesse por parte de diversos projectos para a utilização de mais informação estruturada sobre estes lugares (e.g. CityMotion, iTeam, Aida, etc.), é prentende-se implementar um sistema similar ao Kusco para a língua Portuguesa.
Este estágio insere-se num projecto denominado "SEMA - Selecção de informação baseada em mecanismos de atenção selectiva, enriquecimento semântico e interoperabilidade semântica" que terá início apartir de Fevereiro de 2011 (financiamento em aprovação) Onde será disponibilizada uma plataforma transversal de informação semântica associada a lugares que disponibilizará serviços de acesso a outro projectos.
Objetivo
Este projecto tem como objectivo desenvolver um sistema de Enriquecimento Semântico de Lugares para o Português, que permita ainda classificar áreas geográficas de acordo com a incidência dos serviços oferecidos. O projecto focar-se-á inicialmente na disponibilização de na criação de uma base da dados centralizada e serviços Web que permitam extrair informação da Web (Web Mining) associada a lugares. Quando implementado tal conjunto de serviços, será utilizada um cidadade em território nacional para objecto de estudo de modo a classificar semanticamente áreas geográficas.
Plano de Trabalhos - Semestre 1
O planeamento provisório (primeiro semestre) é o seguinte:
- 15 de Outubro – Estado da arte (1.5 meses)
- 31 de Outubro - Ambientação com o contexto específico do projecto e análise de requisitos (1 mês)
- 15 de Dezembro - Definição do Modelo de Dados e Serviços Web para extracção de informação (1.5 meses)
- 27 de Fevereiro - Relatório intermédio (1 mês)
Plano de Trabalhos - Semestre 2
Para o segundo semestre, espera-se o seguinte conjunto de tarefas:
- 30 de Março - Definição da cidade de estudo e aplicação itensiva dos Serviços Web (1 mês)
- 30 de Abril - Classificação Semântica de Áreas Geográficas (1.5 meses)
- 30 de Maio - Escrita de Artigo (1 mês)
- 30 de Junho - Entrega da dissertação. (1 mês)
Condições
Boas capacidades de programação (Java ou Phyton), Web Crawling e Screen Scrapping.
Outras capacidades importantes são interesse por técnicas de Extracção de Informação, Análise de dados e por Sistemas Ubíquos.
Observações
Co-orientação de Ana Oliveira Alves (investigadora do CISUC).
Este estágio poderá ser remunerado a partir de Fevereiro de 2011 (depende de aprovação de financiamento).
Orientador
Prof. Francisco Câmara Pereira & Ana Alves
camara@dei.uc.pt 📩