← voltar para vagas

pleno em sre - félix pago

@ FÉLIX PAGO · ·REMOTO · REMOTO (BRASIL, MÉXICO, MIAMI OU EUA)

Sobre a vaga

Buscamos um Site Reliability Engineer pleno para trabalhar com infraestrutura em nuvem, automação e observabilidade na Félix Pago. Você vai garantir que nossos sistemas rodem de forma confiável e escalável.

Responsabilidades

  • Manter e otimizar infraestrutura em Google Cloud Platform (GCP)
  • Gerenciar e orquestrar contêineres com Kubernetes e Google Kubernetes Engine (GKE)
  • Automatizar provisionamento de infraestrutura com Terraform e Helm
  • Implementar e monitorar observabilidade com Prometheus, Grafana e OpenTelemetry
  • Responder a incidentes e melhorar processos de confiabilidade
  • Documentar runbooks e procedimentos operacionais

Requisitos

  • Experiência sólida com Kubernetes e containerização (Docker)
  • Conhecimento prático de GCP e ferramentas de infraestrutura como código (Terraform)
  • Proficiência em pelo menos uma linguagem de programação (Go, Python ou Bash)
  • Experiência com monitoramento e alertas (Prometheus, Grafana)
  • Familiaridade com CI/CD (GitHub Actions)
  • Linux avançado
  • Experiência com gestão de incidentes e on-call

Diferenciais

  • Experiência com OpenTelemetry
  • Conhecimento de PagerDuty
  • Histórico de trabalho em ambientes 24/7
§

>> antes de aplicar