Propostas atribuídas

DEI - FCTUC
Gerado a 2024-11-21 20:31:00 (Europe/Lisbon).
Voltar

Titulo Estágio

Creation of an Automated Machine Learning Module for Data Scientists

Áreas de especialidade

Engenharia de Software

Sistemas Inteligentes

Local do Estágio

Coimbra

Enquadramento

Today’s way to interact between a human and a computer system is changing. Computer systems are becoming more intelligent in the way they communicate with humans, with the latest developments in Natural Language Processing helping a lot the improvement of speech recognition and conversational interaction, like bots and home appliances (Echo and Google Home). The days of having computer personal assistants has come, with Siri, Cortana and others. But the problem is that there are still areas more complex to be addressed, namely asking for data analysis to a personal assistant. In Critical Software, we are exploring how communication using Natural Language (chatbots or search engines) can be used to help Data Scientists perform their job faster and better. This is here Automated Machine Learning (or AutoML) comes into play. Our goal in this internship is to integrate AutoML in a Data Science module that is part of a Virtual Assistant platform that we are developing.
Critical Software is developing a Virtual Assistant platform, which is a conversational/search platform that allows the user to do analytical questions and queries in natural language, like: “what are my top 5 customers in USA?” or “list sales product TVs in Japan”. The challenge that we are addressing in this internship is: how can this platform be useful to a Data Scientist job? Can a Data Scientist talk and ask for analysis in natural language? How can AutoML be used in this platform to leverage the user-friendliness of natural language?

Main Keywords: Data Science, Machine Learning, Natural Language Processing, AutoML

Main Technologies: Python, Java

Objetivo

The main goal of this internship is to develop a module in Critical’s platform capable of performing several functionalities that Data Scientists do in their daily work in an automated way (also known as AutoML). These activities have several viewpoints:
- Data Understanding (doing statistical analysis, for example);
- Data Preprocessing (feature engineering, for example);
- Model Creation and Evaluation (automatically select the best algorithm and it’s parameters9.
The engine has to deal with scalability issues and data volume.

Plano de Trabalhos - Semestre 1

The internship has the following stages:
- Defining the Scope and Requirements of the Modules to be Developed [result: requirement list, M1 and M2]
- Reading and Writing the State of the Art [result: state of the art, M1 to M4]
- Study of the Virtual Assistant platform [result: platform description, M1 to M4]
- Creating the Technical Specification [result: technical specification, M5 and M6]
- Writing the internship proposal [result: internship proposal, M5 and M6]

Plano de Trabalhos - Semestre 2

The second semester comprises the following stages:
- Setting up the Development Environment [result: Development Environment, M6]
- Development of the Modules [result: first prototype, M7 to M9]
- Validation and Verification [result: second prototype, M10]
- Writing the internship report [result: internship report, M10 and M11]

Condições

A Critical Software procura um aluno com formação base de engenharia informática e que apresente os conhecimentos técnicos de desenvolvimento de software inerentes às funções a desempenhar no contexto da dissertação proposta, não sendo exigida qualquer experiência profissional prévia.
Na escolha do candidato, a Critical Software tem em conta, não só as suas competências técnicas como as competências comportamentais, sendo que as duas categorias de competências são avaliadas com uma importância semelhante. Espera-se igualmente que o(a) candidato(a) esteja motivado para integrar o programa formativo e de acompanhamento proposto pela Critical Software.
Adicionalmente, o gosto, interesse ou conhecimentos na área de Inteligência Artificial, Sistemas Conversacionais e Machine Learning serão valorizados.
Note-se que é condição para a atribuição do projeto de dissertação a realização de provas de seleção incluindo uma entrevista com os candidatos interessados.

De salientar que, em contexto de dissertação, o foco das mais-valias que o aluno poderá obter estão associadas à aquisição de conhecimentos científicos e desenvolvimento de competências inerentes à sua integração profissional.
O projeto de Dissertação será orientado por um engenheiro da Critical Software em complementaridade à orientação fornecida pela instituição de ensino. O aluno integrará a equipa tendo acesso a todo o programa formativo, de acompanhamento e de avaliação de desempenho inerente a este programa.

O presente projeto de dissertação prevê a atribuição de uma bolsa mensal de 450 euros. Esta bolsa é paga mensalmente e pretende ser uma ajuda para as despesas de deslocação e alimentação do aluno durante este período.

Observações

A informação transmitida pela Critical Software no âmbito do projeto de dissertação, incluindo documentos técnicos ou de gestão, diagramas, código ou outra informação relevante deve ser tratada com a máxima confidencialidade. O candidato a quem for atribuído o projeto de Dissertação deve assinar um acordo de obrigação de confidencialidade (NDA, Non Disclosure Agreement).

Orientador

Paulo Gomes
paulo.gomes@criticalsoftware.com 📩