Titulo Estágio
SURVEILL@home: a BOINC Project for Large-Scale Monitoring of the Internet
Área Tecnológica
Engenharia de Software
Local do Estágio
DEI/CISUC – Grupo SSE
Enquadramento
O estudo do comportamento das aplicações da internet é um problema de importância fundamental. Uma das tarefas associadas a esse estudo passa pela monitorização end-to-end feita à escala da Internet. Para tal é preciso implementar uma infra-estrutura escalável com várias “sondas” de monitorização espalhadas por centenas ou milhares de nós na Internet.
O BOINC (Berkeley Open Infrastructure for Network Computing) é uma plataforma que visa facilitar a implementação de sistemas de computação distribuída voluntária. Existem vários projectos que utilizam os computadores que são disponibilizados no âmbito desta plataforma, como por exemplo: o SETI@home e o DepSpid, entre muitos outros. Por exemplo, o DepSpid é um projecto que procura recolher dados estatísticos sobre a estrutura da Web e determinar dependências entre domínios, recorrendo a um conjunto de crawlers que executam de forma distribuída.
Objetivo
Este estágio tem como propósito o desenvolvimento de um projecto BOINC, ao qual vamos chamar SURVEILL@home. A ideia é fazer uso de milhares computadores pessoais, em regime de computação voluntária, para implementar uma infra-estrutura de estudo da Internet em larga-escala.
Plano de Trabalhos - Semestre 1
Fase A1: Levantamento do estado da arte e familiarização com a criação e desenvolvimento de projectos BOINC.
Nesta fase o estagiário deverá tomar contacto com a tecnologia e deverá produzir um documento que resuma o estado da arte.
Duração: 1.5 meses.
Fase A2: Implementação de um projecto BOINC experimental.
Nesta fase o estagiário deverá começar por instalar e configurar um servidor BOINC. De seguida, deverá implementar o primeiro protótipo da plataforma SURVEILL@home. Os agentes de monitorização serão inicialmente dotados de mecanismos de detecção de falhas baseados na análise da resposta do servidor e deverão monitorizar de forma pormenorizada todos os componentes constituintes de cada página Web.
Duração: 2.5 meses.
Fase A3: Desenvolvimento de um site Web para divulgação do projecto SURVEILL@home.
A angariação de voluntários para um projecto BOINC está intimamente relacionada com a divulgação e a atractividade do projecto. Nesta fase o estagiário deverá desenvolver um site Web com a finalidade de divulgar o projecto BOINC e captar participantes. Deverá existir um sistema de incentivo para obter o maior número de participantes.
Duração: 0.5 mês.
Fase A4: Escrita da proposta de tese.
Duração: 0.5 mês.Plano de Trabalhos - Semestre 2
Fase B1: Projecto BOINC (cont.)
Adição de novas funcionalidades de monitorização e de controlo da infra-estrutura de monitorização. Nesta fase, os agentes serão evoluídos com inclusão de mecanismos de detecção de falhas baseados na análise de desempenho e em mecanismos de validação do conteúdo dos sites. O estagiário deverá ainda desenvolver uma interface que permita a gestão dos agentes, a gestão dos sites Web em monitorização, a criação e gestão das transacções a monitorizar e um sistema que permita analisar as falhas detectadas.
Duração: 1.5 meses.
Fase B2: Colaboração entre Agentes e Optimização da Infra-Estrutura de monitorização.
O correcto diagnóstico das falhas observadas só é possível caso haja correlação de dados entre as várias “sondas”. Nesta fase do projecto devem-se implementar metodologias que permitam a colaboração entre agentes para correlação de dados.
Pretende-se igualmente minimizar o tráfego de informação entre agentes e o servidor BOINC, implementando capacidades de processamento nos próprios agentes distribuídos.
Duração: 1.5 meses.
Fase B3: Teste do Projecto BOINC
Teste da infra-estrutura de monitorização em larga-escala.
Duração: 1 mês.
Fase B4: Escrita da tese.
Duração: 1 mês.Condições
Bolsa de Iniciação à Investigação: Se o desempenho demonstrado nos três primeiros meses de estágio for positivo será atribuída uma bolsa de iniciação à investigação para os seis meses seguintes.
Observações
Será dada preferência a alunos com bons resultados em disciplinas relacionadas com este trabalho, nomeadamente: Aplicações para a Internet, Sistemas Operativos e Sistemas Distribuídos.
Orientador
Prof. Carlos Vaz
cmvaz@dei.uc.pt 📩