← voltar para vagas
cientista de dados júnior - qualidade e ai/ml
Sobre a vaga
A GE Vernova busca uma pessoa Cientista de Dados Júnior para o time de Engenharia de Qualidade e implementação de AI/ML. A vaga é híbrida, com base em Budapeste ou Campinas.
Você vai trabalhar com dados de qualidade vindos de sistemas corporativos, como SAP e Salesforce, para criar análises, relatórios, modelos de Machine Learning e soluções com LLMs que ajudem a prever e prevenir problemas de qualidade.
Responsabilidades
- Analisar dados de qualidade de diferentes sistemas corporativos, incluindo SAP, Salesforce e outros, para encontrar padrões, lacunas e oportunidades de melhoria.
- Definir quais dados são relevantes para casos de uso de qualidade e como eles devem ser acessados, interpretados e usados.
- Transformar desafios de qualidade do negócio em problemas claros de Ciência de Dados, AI e Machine Learning.
- Apoiar o time digital na criação de relatórios centralizados de qualidade, com indicadores e insights para áreas de negócio globais.
- Desenvolver e validar modelos de Machine Learning para casos de uso preventivos e preditivos em qualidade.
- Usar Large Language Models (LLMs) e engenharia de prompts para criar ferramentas inteligentes de apoio à decisão e automação de fluxos de qualidade.
- Colaborar com pessoas de Engenharia de Dados e AI/ML para garantir que os requisitos de dados sejam bem entendidos e implementados em pipelines e infraestrutura.
- Trabalhar com modelos semânticos de dados para manter uma interpretação consistente entre aplicações de qualidade e sistemas de negócio.
- Conversar com stakeholders internos para entender necessidades de dados, levantar requisitos e melhorar soluções com base em feedback real.
- Documentar descobertas analíticas, desempenho de modelos e definições de dados de forma clara e reproduzível.
- Acompanhar avanços em AI, ML e Ciência de Dados e sugerir abordagens que possam melhorar as soluções de qualidade.
Requisitos
- Graduação ou mestrado em Ciência de Dados, Ciência da Computação, Estatística, Matemática, Engenharia ou área técnica relacionada.
- Experiência prática em Ciência de Dados, Análise de Dados ou área relacionada.
- Conhecimento de Python para análise de dados, modelagem estatística e desenvolvimento de modelos de ML.
- Experiência inicial ou intermediária com frameworks e métodos de Machine Learning, como Scikit-learn, XGBoost ou similares.
- Familiaridade com LLMs, engenharia de prompts e aplicações práticas em contexto de negócio.
- Noções de modelos semânticos de dados e modelagem de dados em sistemas diferentes.
- Experiência com dados estruturados e não estruturados vindos de sistemas corporativos, como ERP e CRM.
- Boa comunicação para definir requisitos e trabalhar com times distribuídos.
- Inglês fluente para escrita e conversação.
Diferenciais
- Experiência em startup ou ambiente digital de ritmo acelerado.
- Vivência com SAP, Salesforce ou outros sistemas ERP/CRM do ponto de vista de consumo de dados.
- Experiência com serviços AWS para Ciência de Dados, como SageMaker, S3 e Lambda.
- Conhecimento de SQL e experiência consultando bancos relacionais ou NoSQL.
- Contato com princípios de MLOps, como versionamento de modelos, acompanhamento de experimentos e noções de deploy.
- Noções de governança de dados e práticas de AI responsável.
- Experiência em times internacionais, multiculturais e distribuídos em diferentes fusos horários.
- Outros idiomas além do inglês.
Benefícios
- Assistência para relocação disponível.