Titulo Estágio
CiteSEARCH: Efficient Web crawler for citations aggregation
Áreas de especialidade
Sistemas de Informação
Local do Estágio
DEI-FCTUC
Enquadramento
It current practice, the evaluation of faculty members and research centers is based on the impact and quality of their publications in conferences, workshops, journals, etc. Therefore, citation analysis is increasingly becoming important and a common method to obtain a more objective assessment of research teams. Consequently, there is a need to identify as many citations as possible for the published work. Unfortunately, no automated means exist to find and integrate the citations which can be scattered across many Web sources. In its current form, researchers need to manually browse the Internet and select one by one the references they find for their work. Clearly, there is “room” for improvement. This project proposal is about find better ways to carry out citation analysis.
Objetivo
In this project, we propose to develop a Web application to automatically crawl the Web for citations. The application must be able to search and integrate citations from many sources such as the Institute for Scientific Information’s (ISI) citation databases, Scopus, Google Scholar, Web of Science, Microsoft academics, etc. The integration of results is of upmost importance since studies suggests that Google Scholar alone only contain between 40% and 70% of the citations (Yang and Meho, 2006).
Yang, K., & Meho, L.I. Citation Analysis: A Comparison of Google Scholar, Scopus, and Web of Science, 2006. In 69th Annual Meeting of the American Society for Information Science and Technology (ASIST),Austin (US),3-8 November 2006.Richard B. Hill.
Plano de Trabalhos - Semestre 1
(a) Descrição do business use-case da procura de citações (Setembro de 2014)
(b) Especificação de requisitos e estudo das tecnologias usadas no projecto (Outubro a Novembro de 2014). Análise e definição dos requisitos do sistema a desenvolver.
(c) Arquitectura e design (Dezembro de 2014 a Janeiro de 2015) – definição do design detalhado arquitectura do sistema a implementar até final do Estágio. Prototipagem rápida para ilustrar e ajudar a definir os requisitos funcionais assim como gerar a primeira versão do sistema.
(d) Escrita e defesa do relatório intermédio de estágio (Dezembro de 2014 e Janeiro de 2015).
(e) Primeiro protótipo (Fevereiro de 2015). Descrição da primeira versão da abordagem/algoritmo/use-case com previsão da próxima acção.
Plano de Trabalhos - Semestre 2
(f) Construção (Fevereiro a Maio de 2015) – Codificação dos módulos definidos. 2ª versão do use-case incluindo previsão melhorada da integração de citações.
(g) Testes (Abril a Junho de 2015) – definição e execução dos casos de teste dos diversos módulos.
(h) Documentação (a decorrer ao longo de todo o estágio) – integração e revisão da documentação produzida em cada fase do estágio no conjunto de documentos finais que descrevem o trabalho efectuado tecnicamente e na perspectiva do utilizador.
(i) Escrita e defesa do relatório de estágio (Maio a Julho de 2015). Entrega da versão final do use-case e documentação técnica.
Condições
Este trabalho será realizado no DEI/Universidade de Coimbra. Será disponibilizado um local de trabalho apropriado e todos os recursos computacionais necessários.
Mestrado não remunerado.
Orientador
Jorge Cardoso
jcardoso@dei.uc.pt 📩