ANALISTA DE TI III (Analista CRE) - TEMPORÁRIO (CASA VERDE)
Atuar na garantia da disponibilidade, resiliência e performance de aplicações e serviços em ambientes cloud, com foco em automação, observabilidade e melhoria contínua.
Esse(a) profissional será responsável por assegurar que os sistemas operem de forma confiável em produção, atuando na prevenção de incidentes, resposta a falhas e evolução da arquitetura para suportar crescimento com estabilidade.
O papel combina práticas de SRE, Cloud Engineering e DevOps, com foco em confiabilidade e eficiência operacional.
Principais responsabilidades
- Garantir a disponibilidade e confiabilidade de sistemas críticos em ambiente cloud (Azure/OCI).
- Definir, implementar e acompanhar SLIs, SLOs e SLAs das aplicações.
- Atuar na gestão de incidentes, incluindo resposta, mitigação, comunicação e análise de causa raiz (RCA).
- Monitorar continuamente sistemas e aplicações, identificando anomalias, degradação de performance e riscos operacionais.
- Implementar e evoluir soluções de observabilidade (logs, métricas, tracing).
- Automatizar processos operacionais, reduzindo atividades manuais (toil) e aumentando a eficiência do ambiente.
- Atuar na construção e evolução de ambientes resilientes e altamente disponíveis.
- Trabalhar em conjunto com times de desenvolvimento e DevOps para melhorar a confiabilidade das aplicações desde o design.
- Implementar estratégias de tolerância a falhas e recuperação (failover, redundância, disaster recovery).
- Apoiar a definição de arquitetura cloud com foco em escalabilidade e resiliência.
- Analisar capacidade e desempenho dos sistemas, propondo melhorias contínuas.
- Criar e manter documentação operacional, runbooks e playbooks de incidentes.
- Participar de processos de melhoria contínua pós-incidente.
Requisitos obrigatórios
- Experiência com ambientes cloud (Azure e OCI).
- Experiência com práticas de confiabilidade:
- Gestão de incidentes
- Análise de causa raiz (RCA)
- Monitoramento e troubleshooting
- Experiência com ferramentas de observabilidade:
- Experiência com automação de tarefas operacionais.
- Conhecimento em Infraestrutura como Código (IaC).
- Experiência com ambientes Linux.
- Conhecimento em arquitetura de sistemas distribuídos.
- Experiência com troubleshooting de aplicações em produção.
- Conhecimento em redes, disponibilidade e performance.
- Experiência com versionamento (Git).
- Experiência com Kubernetes (AKS).
- Conhecimento em ferramentas de observabilidade:
- Azure Monitor
- Application Insights
Requisitos desejáveis
- Experiência com definição de SLO, SLA e SLI.
- Conhecimento em ferramentas de observabilidade:
- Experiência com ferramentas de automação e scripting:
- Conhecimento em práticas de SRE:
- Redução de MTTR
- Gestão de erro budget
- Experiência com pipelines CI/CD.
- Conhecimento em segurança em cloud.
- Experiência com testes de resiliência (chaos engineering – diferencial).
- Vivência com ambientes de alta criticidade.
Salário: 11.359,00 + VT + VR
Horário: Segunda a sexta-feira das 10h às 19h
Local: Casa Verde - Zona Norte