← voltar para vagas
cientista de dados júnior - engenharia de qualidade e ai/ml
Sobre a vaga
A GE Vernova busca uma pessoa Cientista de Dados Júnior para atuar no time de Engenharia de Qualidade e implementação de AI/ML. A vaga é híbrida, com base em Budapeste ou Campinas.
Você vai trabalhar com dados de qualidade vindos de sistemas corporativos como SAP e Salesforce, ajudando a transformar esses dados em relatórios, modelos de Machine Learning e soluções com LLMs para prever e prevenir problemas de qualidade.
Responsabilidades
- Analisar dados de qualidade de diferentes sistemas corporativos para encontrar padrões, lacunas e oportunidades de melhoria.
- Definir quais dados são relevantes para casos de uso de qualidade e como devem ser acessados, interpretados e usados.
- Traduzir desafios de negócio em problemas práticos de Data Science, AI/ML e análise de dados.
- Apoiar a criação de relatórios centralizados de qualidade, com KPIs e insights para áreas de negócio em diferentes países.
- Desenvolver e validar modelos de Machine Learning para casos de uso preventivos e preditivos.
- Usar LLMs e engenharia de prompts para criar ferramentas que apoiem decisões e automatizem fluxos de qualidade.
- Colaborar com Data Engineers e AI/ML Engineers para garantir que requisitos de dados sejam bem entendidos e implementados.
- Trabalhar com modelos semânticos de dados para manter uma interpretação consistente entre sistemas e aplicações.
- Conversar com pessoas de áreas internas para entender necessidades, levantar requisitos e ajustar soluções com base em feedback real.
- Documentar descobertas, desempenho de modelos e definições de dados de forma clara e reproduzível.
- Acompanhar novidades em AI, Machine Learning e Data Science, sugerindo abordagens que possam melhorar as soluções do time.
Requisitos
- Graduação ou mestrado em Data Science, Ciência da Computação, Estatística, Matemática, Engenharia ou área técnica relacionada.
- Experiência prática em Data Science, análise de dados ou área relacionada.
- Bom domínio de Python para análise de dados, modelagem estatística e desenvolvimento de modelos de ML.
- Conhecimento básico a intermediário de frameworks e métodos de Machine Learning, como Scikit-learn, XGBoost ou similares.
- Familiaridade com LLMs, engenharia de prompts e aplicações práticas em contexto de negócio.
- Noções de modelos semânticos de dados e modelagem de dados em sistemas diferentes.
- Experiência com dados estruturados e não estruturados vindos de sistemas corporativos, como ERP ou CRM.
- Boa comunicação para definir requisitos e trabalhar com times digitais distribuídos.
- Perfil curioso, proativo e confortável em ambientes dinâmicos.
- Inglês fluente para escrita e conversa.
Diferenciais
- Saber analisar, interpretar e explicar achados de dados para públicos técnicos e não técnicos.
- Primeira experiência com plataformas como SAP, Salesforce ou outros sistemas ERP/CRM, pelo lado de consumo de dados.
- Experiência com serviços AWS para Data Science, como SageMaker, S3 e Lambda.
- Conhecimento de SQL e experiência consultando bancos relacionais ou NoSQL.
- Contato com práticas de MLOps, como versionamento de modelos, acompanhamento de experimentos e noções de deploy.
- Noções de governança de dados e práticas de AI responsável.
- Experiência em times internacionais, multiculturais ou trabalhando com fusos horários diferentes.
- Conhecimento de outros idiomas além do inglês.
Benefícios
- Auxílio realocação informado pela empresa.