Titulo Estágio
Intelligent Document Validation Using Computer Vision and Natural Language Processing
Áreas de especialidade
Engenharia de Software
Sistemas Inteligentes
Local do Estágio
Coimbra
Enquadramento
Most processes in organisations still have a huge number of documents that must be submitted by customers or users. Like applying for a visa or opening a new bank account. Most of these are official documents and are needed for validating the applicant/customer identity and context, which are then manually validated by an institution’s employee. This takes time and is prone to errors, even if the error rate is small, the damage caused by it can be big. CRITICAL Software has currently in development a solution that addresses this need, using techniques from Computer Vision, Machine Learning, and Natural Language Processing. The IDV system validates if a submitted document is what is supposed to be, and also extracts useful information out of it, making the human's work of document validation and extraction much more efficient and less error prone.
In this internship proposal, the goal is to integrate the current IDV team and help develop new models to detect and extract structured information from the documents.
Main Keywords: Deep Learning, Computer Vision, Image Processing,
Machine Learning, Natural Language Processing
Main Technologies: Python, Tensorflow
Objetivo
The main goal of this internship is to create and integrate into the current IDV platform, new solutions and Machine Learning models, that improve the performance of the currently deployed solutions. Namely on the classification of document types, on the detection of important structures in documents, and on the extraction of field values. The intern will research and choose possible solutions to implement, however, there are already some internal research on possible techniques to evaluate, such as: automatic data augmentation, transfer learning, deep learning, or neuroevolution.
Plano de Trabalhos - Semestre 1
The internship has the following stages:
- Defining the Scope and Requirements [result: requirements list, months 1-2]
- Reading and Writing the State of the Art [result: state of the art, months 1-4]
- Study the current IDV platform [result: platform description and comparison, months 1-4]
- Creating the Technical Specification [result: technical specification, months 5-6]
- Writing the internship proposal [result: internship proposal, months 2-6]
Plano de Trabalhos - Semestre 2
The second semester comprises the following stages:
- Setting up the Research and Development environments [result: Development Environment, month 7]
- Development of IDV [result: first prototype, months 7-10]
- Testing and Benchmarking [result: second prototype, months 11]
- Writing the internship report [result: internship report, months 11-12]
Condições
A Critical Software procura um aluno com formação base de engenharia informática e que apresente os conhecimentos técnicos de desenvolvimento de software inerentes às funções a desempenhar no contexto da dissertação proposta, não sendo exigida qualquer experiência profissional prévia.
Na escolha do candidato, a Critical Software tem em conta, não só as suas competências técnicas como as competências comportamentais, sendo que as duas categorias de competências são avaliadas com uma importância semelhante. Espera-se igualmente que o(a) candidato(a) esteja motivado para integrar o programa formativo e de acompanhamento proposto pela Critical Software.
Adicionalmente, o gosto, interesse ou conhecimentos na área de Inteligência Artificial serão valorizados.
Note-se que é condição para a atribuição do projeto de dissertação a realização de provas de seleção incluindo uma entrevista com os candidatos interessados.
De salientar que, em contexto de dissertação, o foco das mais-valias que o aluno poderá obter estão associadas à aquisição de conhecimentos científicos e desenvolvimento de competências inerentes à sua integração profissional.
O projeto de Dissertação será orientado por um engenheiro da Critical Software em complementaridade à orientação fornecida pela instituição de ensino. O aluno integrará a equipa tendo acesso a todo o programa formativo, de acompanhamento e de avaliação de desempenho inerente a este programa.
O presente projeto de dissertação prevê a atribuição de uma bolsa mensal de 450 euros. Esta bolsa é paga mensalmente e pretende ser uma ajuda para as despesas de deslocação e alimentação do aluno durante este período.
Observações
A informação transmitida pela Critical Software no âmbito do projeto de dissertação, incluindo documentos técnicos ou de gestão, diagramas, código ou outra informação relevante deve ser tratada com a máxima confidencialidade. O candidato a quem for atribuído o projeto de Dissertação deve assinar um acordo de obrigação de confidencialidade (NDA, Non Disclosure Agreement).
Orientador
Paulo Gomes
paulo.gomes@criticalsoftware.com 📩