Titulo Estágio
Automatic Document Clasification Using Computer Vision and Natural Language Processing
Áreas de especialidade
Sistemas Inteligentes
Local do Estágio
Coimbra
Enquadramento
Most processes in organisations still have a huge number of documents that must be submitted by customers or users. Like applying for a visa or opening a new bank account. Most of these are official documents and are needed for validating the applicant/customer identity and context, which are then manually validated by an institution’s employee. This takes time and is prone to errors, even if the error rate is small, the damage caused by it can be big. CRITICAL Software has currently in development a solution that addresses this need, using techniques from Computer Vision, Machine Learning, and Natural Language Processing. The IDV system validates if a submitted document is what it is supposed to be, and also extracts useful information out of it, making the human's work of document validation and extraction much more efficient and less error prone.
In this internship proposal, the goal is to integrate the current IDV team and help develop new models to classify documents using both its image and the extracted text.
Main Keywords: Deep Learning, Computer Vision, Image Processing, Machine Learning, Natural Language Processing
Main Technologies: Python, Tensorflow or Pytorch
Objetivo
The main goal of this internship is to create and integrate into the current IDV platform, new solutions and Machine Learning models, that improve the performance upon the currently used models, and enable the automation (where possible) of the training of IDV for new document types. Namely on the classification of these document types.
The intern will research and choose possible solutions to implement, however, there are already some internal research on possible techniques to evaluate, such as: mixed format input (visual and textual), automatic data augmentation, transfer learning, deep learning, or neuroevolution.
Plano de Trabalhos - Semestre 1
The internship has the following stages:
- Defining the Scope and Requirements [result: requirements list, months 1-2]
- Reading and Writing the State of the Art [result: state of the art, months 1-4]
- Study the current IDV platform [result: platform description and comparison, months 1-4]
- Creating the Technical Specification [result: technical specification, months 5-6]
- Writing the internship proposal [result: internship proposal, months 2-6]
Plano de Trabalhos - Semestre 2
The second semester comprises the following stages:
- Setting up the Research and Development environments [result: Development Environment, month 7]
- Development of IDV [result: first prototype, months 7-10]
- Testing and Benchmarking [result: second prototype, months 11]
- Writing the internship report [result: internship report, months 11-12]
Condições
Perfil
A Critical Software procura um aluno com formação base de engenharia informática e que apresente os conhecimentos técnicos de desenvolvimento de software inerentes às funções a desempenhar no contexto da proposta de estágio, não sendo exigida qualquer experiência profissional prévia.
Na escolha do candidato, a Critical Software tem em conta, não só as suas competências técnicas como as competências comportamentais, sendo que as duas categorias de competências são avaliadas com uma importância semelhante. Espera-se igualmente que o(a) candidato(a) esteja motivado para integrar o programa formativo e de acompanhamento proposto pela Critical Software.
Adicionalmente, o gosto, interesse ou conhecimentos na área de acessibilidade digital serão valorizados.
Note-se que é condição para a atribuição do estágio a realização de provas de seleção incluindo uma entrevista com os candidatos interessados.
Bolsa de dissertação
O presente projeto de dissertação prevê a atribuição de uma bolsa mensal de 450 euros. Esta bolsa é paga mensalmente e pretende ser uma ajuda para as despesas de deslocação e alimentação do aluno durante este período.
De salientar que, em contexto de dissertação, o foco das mais-valias que o aluno poderá obter estão associadas à aquisição de conhecimentos científicos e desenvolvimento de competências inerentes à sua integração profissional.
Orientação
O estágio será orientado por um engenheiro da Critical Software em complementaridade à orientação fornecida pela instituição de ensino.
O aluno integrará a equipa tendo acesso a todo o programa formativo, de acompanhamento e de avaliação de desempenho.
Observações
A informação transmitida pela Critical Software no âmbito do estágio, incluindo documentos técnicos ou de gestão, diagramas, código ou outra informação relevante deve ser tratada com a máxima confidencialidade. O candidato a quem for atribuído o projeto de Dissertação deve assinar um acordo de obrigação de confidencialidade (NDA, Non Disclosure Agreement).
Orientador
Tiago Rodrigues Baptista
tiago.baptista@criticalsoftware.com 📩