Titulo Estágio
AICOD- Categorização Automática e Inteligente de Documentos: Módulo de Aprendizagem Avançada
Área Tecnológica
Engenharia de Software, Programação e Aprendizagem Avançada
Local do Estágio
Centro de Informática e Sistemas, CISUC, Grupo de Computação Adaptativa, Lab: LARN
Enquadramento
Com a ubiquidade da Internet, a quantidade de documentos em formato digital multiplica-se e torna cada vez mais crucial a sua organização automática. O sistema AICOD – Automatic Intelligent Categorization of Documents (http://aicod.dei.uc.pt) é uma aplicação desenvolvida para que os utilizadores possam efectuar a categorização dos seus documentos de forma auotmática o que permite optimizar o tempo utilizado quando as tarefas de organização, filtragem e encaminhamento de documentos são realizadas de uma forma manual.
O sistema recebe documentos de texto (em qualquer formato) que podem ser imagens, páginas web ou emails. A aplicação desenvolvida implementa uma framework de categorização automática de documentos que possibilita a execução, parametrização e mesmo substituição de métodos para todas as fases de sistema, nomeadamente, receber e representar um conjunto de textos em vários formatos possíveis (email, HTML, SGML,...), reduzir a dimensão do espaço de características, aprendizagem e classificação. Foi ainda efectuada a implementação, o teste e a comparação de um conjunto de algoritmos standard (redes neuronais, SVM,...) recorrendo a versões implementadas em Java destes algoritmos e disponíveis publicamente, nomeadamente o Weka Data Mining Software, disponível em www.cs.waikato.ac.nz/ml/weka/.
Objetivo
O resultado deste estágio deve ser a implementação de um módulo de aprendizagem avançada, que inclua métodos inteligentes de redução de características e utilização e configuração de classificadores múltiplos que permitam integrar o sistema já desenvolvido, contribuindo para a construção de uma framework. Para além disso, devem ainda ser incorporadas na framework a possibilidade de visualização de resultados bem como a possibilidade de interacção avançada com um utilizador especialista capaz de introduzir dinâmica no sistema (novos métodos por exemplo).
Plano de Trabalhos - Semestre 1
- Revisão bibliográfica
- Estudo das ferramentas de
desenvolvimento.
- Análise e especificação.
- Relatório Intermédio de Estágio
Plano de Trabalhos - Semestre 2
- Implementação do protótipo do módulo e
integração no sistema AICOD.
- Testes e experimentação.
- Relatório de estágio.
Condições
Conhecimentos
de Java e XML.
Orientador
Bernardete Ribeiro & Catarina Silva
bribeiro@dei.uc.pt 📩