Colocações 2011/2012

DEI - FCTUC
Gerado a 2024-04-29 13:23:38 (Europe/Lisbon).
Voltar

Titulo Estágio

CiteSEARCH: Efficient Web crawler for citations aggregation

Área Tecnológica

Sistemas de Informação

Local do Estágio

DEI-FCTUC

Enquadramento

It current practice, the evaluation of faculty members and research centers is based on the impact and quality of their publications in conferences, workshops, journals, etc. Therefore, citation analysis is increasingly becoming important and a common method to obtain a more objective assessment of research teams. Consequently, there is a need to identify as many citations as possible for the published work. Unfortunately, no automated means exist to find and integrate the citations which can be scattered across many Web sources. In its current form, researchers need to manually browse the Internet and select one by one the references they find for their work. Clearly, there is “room” for improvement. This project proposal is about find better ways to carry out citation analysis.

Objetivo

In this project, we propose to develop a Web application to automatically crawl the Web for citations. The application must be able to search and integrate citations from many sources such as the Institute for Scientific Information’s (ISI) citation databases, Scopus, Google Scholar, Web of Science, Microsoft academics, etc. The integration of results is of upmost importance since studies suggests that Google Scholar alone only contain between 40% and 70% of the citations (Yang and Meho, 2006).

Yang, K., & Meho, L.I. Citation Analysis: A Comparison of Google Scholar, Scopus, and Web of Science, 2006. In 69th Annual Meeting of the American Society for Information Science and Technology (ASIST),Austin (US),3-8 November 2006.Richard B. Hill.

Plano de Trabalhos - Semestre 1

(a) Descrição do business use-case da procura de citações (Setembro de 2012)

(b) Especificação de requisitos e estudo das tecnologias usadas no projecto (Outubro a Novembro de 2011). Análise e definição dos requisitos do sistema a desenvolver.

(c) Arquitectura e design (Dezembro de 2012 a Janeiro de 2013) – definição do design detalhado arquitectura do sistema a implementar até final do Estágio. Prototipagem rápida para ilustrar e ajudar a definir os requisitos funcionais assim como gerar a primeira versão do sistema.

(d) Escrita e defesa do relatório intermédio de estágio (Dezembro de 2012 e Janeiro de 2013).

(e) Primeiro protótipo (Fevereiro de 2013). Descrição da primeira versão da abordagem/algoritmo/use-case com previsão da próxima acção.

Plano de Trabalhos - Semestre 2

(f) Construção (Fevereiro a Maio de 2013) – Codificação dos módulos definidos. 2ª versão do use-case incluindo previsão melhorada da integração de citações.

(g) Testes (Abril a Junho de 2013) – definição e execução dos casos de teste dos diversos módulos.

(h) Documentação (a decorrer ao longo de todo o estágio) – integração e revisão da documentação produzida em cada fase do estágio no conjunto de documentos finais que descrevem o trabalho efectuado tecnicamente e na perspectiva do utilizador.

(i) Escrita e defesa do relatório de estágio (Maio a Julho de 2013). Entrega da versão final do use-case e documentação técnica.

Condições

Este trabalho será realizado no DEI/Universidade de Coimbra. Será disponibilizado um local de trabalho apropriado e todos os recursos computacionais necessários.

Observações

O projecto será orientado em conjunção com a Professora Dra. Bernardete Ribeiro.

Orientador

Jorge Cardoso
jcardoso@dei.uc.pt 📩