machine learning junior: como entrar de verdade no brasil
Falar “quero trabalhar com machine learning” em 2026 abre duas reações. A primeira é entusiasmo: todo mundo quer dev que entenda IA. A segunda é confusão: quando você abre a vaga, o título diz “machine learning junior”, mas o que está escrito pede SQL, dashboard, pipeline e “familiaridade com modelos”. Não é exatamente o que você imaginava.
Respira. Isso não é armadilha, é o mercado real.
Machine learning virou rótulo genérico. Por baixo dele existe um leque de caminhos: analista de dados, engenheiro de ML, cientista de dados, pessoa de pesquisa aplicada, engenheiro de IA aplicada. Cada um tem porta de entrada, stack e salário diferentes. Antes de decidir o que estudar, você precisa saber em qual desses caminhos cabe um junior no Brasil. Este texto separa o que é hype do que é oportunidade concreta, sem pedir que você faça mestrado antes da primeira vaga.
primeiro: o que “machine learning junior” significa de verdade
A maioria das vagas com “machine learning” ou “IA” no título, no nível junior, não é cargo de pesquisa. É cargo de dados com algum componente de modelo. A empresa quer alguém que:
- limpe e entenda dados (SQL, Python, pandas);
- construa relatório e dashboard (Power BI, Metabase, Looker Studio);
- rode um modelo simples quando preciso (regressão, classificação, clusterização);
- explique o resultado para gente de negócio.
Isso é, na prática, analista de dados júnior com pitada de modelagem. Quem entende isso para de procurar a vaga inexistente de “cientista de ML sem experiência” e começa a mirar nas vagas que existem de verdade. Para enxergar o mercado real, abra a lista de vagas tech no Brasil e filtre por dados: leia o corpo da vaga, não só o título.
Se você quer o caminho mais puro de modelagem, ele existe, mas costuma passar por pesquisa aplicada em institutos (CPQD, Lactec), bancos grandes com área de ciência de dados ou estágio em universidade. Nesses casos, mestrado ajuda a subir — mas não é obrigatório para entrar como estagiário ou trainee.
as portas reais de entrada
Existem quatro caminhos que costumam contratar junior. Escolha um antes de espalhar energia.
1. Dados / analytics. É a porta mais larga. Envolve SQL, Python para análise, dashboard e estatística básica. Aqui cabe quem está começando do zero. Se esse for seu caso, comece pelo guia de portfólio de dados para junior e pelo de escolher stack para a primeira vaga.
2. Engenharia de software + ML (MLOps). Você entra como dev backend e aprende a colocar modelo em produção: API, container, pipeline, monitoramento. É a porta para quem já gosta mais de programar do que de estatística.
3. IA aplicada com LLM. A porta que mais cresceu em 2026. Envolve RAG, embeddings, avaliação de modelo, prompt e agente. É acessível a quem vem de backend ou frontend, porque o coração é software, não pesquisa. Vale ler como usar IA na busca por vaga junior para entender onde a IA já toca o seu dia a dia de candidatura.
4. Pesquisa aplicada. CPQD, IBM Research, bancos, startups de deep tech. Costuma ser estágio ou trainee. Exige base matemática mais forte e, às vezes, mestrado para subir — mas não para entrar.
o que estudar (e o que deixar pra depois)
A armadilha clássica é acumular curso. Quem estuda ML por meses sem projeto termina com certificado e sem história. Estude com intenção, em camadas.
Base inegociável:
- Python sólido: não só script, mas funções, teste, tratamento de erro, virtualenv.
- SQL: aparece em quase toda vaga de dados. É o que mais derruba candidato.
- Estatística e probabilidade na intuição: média, mediana, variância, distribuição, correlação, viés, amostra. Não precisa decorar fórmula; precisa saber quando ela se aplica.
- Git e linha de comando. Sem isso, você não entrega.
Camada de dados:
- pandas e numpy para manipular tabela.
- um de visualização: matplotlib, seaborn ou Plotly.
- um de dashboard: Power BI, Metabase ou Looker Studio.
Camada de modelagem:
- scikit-learn para baseline, métrica (acurácia, precisão, recall, F1, ROC), validação cruzada e overfitting.
- um framework de deep learning só quando o projeto pedir. Em 2026, PyTorch é o mais pedido; TensorFlow caiu de uso.
Camada aplicada (LLM):
- consumo de API, embeddings, RAG simples e avaliação de saída. É a camada mais acessível e a que mais diferencia candidato junior hoje.
O que deixar pra depois: Kubernetes avançado, Spark em cluster gigante, paper de transformer lido do zero, mestrado. Nada disso abre a primeira vaga mais rápido.
portfólio que funciona (e o que quebra a credibilidade)
Recrutador e pessoa técnica de ML olham três coisas no seu portfólio: pergunta, baseline e limite. Se falta um dos três, o projeto parece clone.
Receita para 3 projetos:
- Um projeto de dados. Pergunta de negócio, dataset real, limpeza, visualização e conclusão honesta.
- Um projeto de modelagem simples. Problema de classificação ou regressão com baseline ingênuo, métrica comparada e discussão de overfitting. Mostre por que o modelo é melhor do que chutar a média.
- Um projeto aplicado. Pode ser um RAG sobre documentos seus, um eval de LLM ou um modelo simples exposto em API. O ponto é mostrar ponta a ponta.
O que quebra credibilidade: “prever a bolsa”, “prever resultado de futebol” ou “prever pandemia” sem baseline; notebook do Kaggle refeito igual ao de todo mundo; chamar wrapper de API de “minha IA”; modelo sem métrica e sem explicação. O guia de portfólio de dados para junior aprofunda o roteiro de dataset, README e deploy.
onde achar vaga real (e como ler o título)
Abra o eu.dev.br e filtre por dados, IA e pesquisa. Empresas brasileiras que costumam ter pipeline de junior em dados e ML: CPQD, IBM, bancos (Itaú, Bradesco, Nubank, Inter), Stefanini, CI&T, Accenture e startups de IA. Quando aparecer vaga de “machine learning junior”, leia o corpo. Se pede cinco anos e mestrado, não é junior de verdade; pule. Se pede SQL, Python e “familiaridade com modelos”, é a sua porta.
Quem está montando rotina de candidatura deve ler o guia de rotina semanal de fontes para vaga junior e o de como filtrar vaga remota junior. Para não confundir vaga real com rótulo inflado, cruze com vaga fake junior: como identificar.
entrevista e teste em dados e ML
O teste técnico de dados e ML costuma ter três formatos: SQL ao vivo, interpretação de métrica e case de take-home com dataset. O erro mais comum é tentar modelo complexo e entregar pela metade. O acerto é baseline simples, métrica clara e conclusão honesta.
- Para o live de SQL e estatística, leia entrevista técnica junior.
- Para o take-home com dataset, leia teste técnico para junior — o conselho de limitar escopo vale dobrado aqui.
- Depois do teste, o debrief de teste técnico junior ajuda a transformar resultado em ajuste.
salário: o que esperar na entrada
Faixa de entrada em dados e analista varia bastante por região, contrato (CLT vs PJ) e porte da empresa. Em geral, analista de dados júnior costuma começar numa faixa mais modesta; engenharia de ML e IA aplicada, por exigirem base de software, costumam pagar melhor logo de cara. Os números mudam rápido e dependem de negociação — por isso o melhor movimento é ler salário junior no Brasil para o contexto de contrato e região, e pretensão salarial para vaga junior antes de responder a pergunta de faixa. Não existe número mágico; existe faixa com contexto.
se você vem de outra área
Quem vem de engenharia, exatas, economia, biologia ou saúde leva vantagem real em ML: já pensou em dado, métrica e incerteza. O guia de transição de carreira para tech mostra como transformar esse histórico em evidência em vez de desculpa.
o resumo prático
- Escolha uma porta: dados, engenharia de ML, IA aplicada ou pesquisa.
- Estude em camadas: Python e SQL antes de framework.
- Faça 3 projetos com pergunta, baseline e limite.
- Leia o corpo da vaga, não só o título.
- Não perca tempo tentando virar pesquisador antes da primeira vaga.
Machine learning não é clube fechado para quem tem doutorado. É um campo onde junior entra pelo lado do dado, do software ou da IA aplicada — e cresce com projeto honesto. A vaga existe. Ela só não se chama exatamente do jeito que você imaginava.