← voltar para vagas
pleno em sre - félix pago
Sobre a vaga
Buscamos um Site Reliability Engineer pleno para trabalhar com infraestrutura em nuvem, automação e observabilidade na Félix Pago. Você vai garantir que nossos sistemas rodem de forma confiável e escalável.
Responsabilidades
- Manter e otimizar infraestrutura em Google Cloud Platform (GCP)
- Gerenciar e orquestrar contêineres com Kubernetes e Google Kubernetes Engine (GKE)
- Automatizar provisionamento de infraestrutura com Terraform e Helm
- Implementar e monitorar observabilidade com Prometheus, Grafana e OpenTelemetry
- Responder a incidentes e melhorar processos de confiabilidade
- Documentar runbooks e procedimentos operacionais
Requisitos
- Experiência sólida com Kubernetes e containerização (Docker)
- Conhecimento prático de GCP e ferramentas de infraestrutura como código (Terraform)
- Proficiência em pelo menos uma linguagem de programação (Go, Python ou Bash)
- Experiência com monitoramento e alertas (Prometheus, Grafana)
- Familiaridade com CI/CD (GitHub Actions)
- Linux avançado
- Experiência com gestão de incidentes e on-call
Diferenciais
- Experiência com OpenTelemetry
- Conhecimento de PagerDuty
- Histórico de trabalho em ambientes 24/7