ANALISTA DE TI III (Analista CRE) - TEMPORÁRIO (CASA VERDE)       1 Vaga


ANALISTA DE TI III (Analista CRE) - TEMPORÁRIO (CASA VERDE)

Atuar na garantia da disponibilidade, resiliência e performance de aplicações e serviços em ambientes cloud, com foco em automação, observabilidade e melhoria contínua.
Esse(a) profissional será responsável por assegurar que os sistemas operem de forma confiável em produção, atuando na prevenção de incidentes, resposta a falhas e evolução da arquitetura para suportar crescimento com estabilidade.
O papel combina práticas de SRE, Cloud Engineering e DevOps, com foco em confiabilidade e eficiência operacional.
 
Principais responsabilidades

  • Garantir a disponibilidade e confiabilidade de sistemas críticos em ambiente cloud (Azure/OCI).
  • Definir, implementar e acompanhar SLIs, SLOs e SLAs das aplicações.
  • Atuar na gestão de incidentes, incluindo resposta, mitigação, comunicação e análise de causa raiz (RCA).
  • Monitorar continuamente sistemas e aplicações, identificando anomalias, degradação de performance e riscos operacionais.
  • Implementar e evoluir soluções de observabilidade (logs, métricas, tracing).
  • Automatizar processos operacionais, reduzindo atividades manuais (toil) e aumentando a eficiência do ambiente.
  • Atuar na construção e evolução de ambientes resilientes e altamente disponíveis.
  • Trabalhar em conjunto com times de desenvolvimento e DevOps para melhorar a confiabilidade das aplicações desde o design.
  • Implementar estratégias de tolerância a falhas e recuperação (failover, redundância, disaster recovery).
  • Apoiar a definição de arquitetura cloud com foco em escalabilidade e resiliência.
  • Analisar capacidade e desempenho dos sistemas, propondo melhorias contínuas.
  • Criar e manter documentação operacional, runbooks e playbooks de incidentes.
  • Participar de processos de melhoria contínua pós-incidente.
 
Requisitos obrigatórios
  • Experiência com ambientes cloud (Azure e OCI).
  • Experiência com práticas de confiabilidade:
    • Gestão de incidentes
    • Análise de causa raiz (RCA)
    • Monitoramento e troubleshooting
  • Experiência com ferramentas de observabilidade:
    • Logs
    • Métricas
    • Tracing
  • Experiência com automação de tarefas operacionais.
  • Conhecimento em Infraestrutura como Código (IaC).
  • Experiência com ambientes Linux.
  • Conhecimento em arquitetura de sistemas distribuídos.
  • Experiência com troubleshooting de aplicações em produção.
  • Conhecimento em redes, disponibilidade e performance.
  • Experiência com versionamento (Git).
  • Experiência com Kubernetes (AKS).
  • Conhecimento em ferramentas de observabilidade:
    • Azure Monitor
    • Application Insights
 
Requisitos desejáveis
  • Experiência com definição de SLO, SLA e SLI.
  • Conhecimento em ferramentas de observabilidade:
    • Prometheus / Grafana
  • Experiência com ferramentas de automação e scripting:
    • Shell
    • Python
    • PowerShell
  • Conhecimento em práticas de SRE:
    • Redução de MTTR
    • Gestão de erro budget
  • Experiência com pipelines CI/CD.
  • Conhecimento em segurança em cloud.
  • Experiência com testes de resiliência (chaos engineering – diferencial).
  • Vivência com ambientes de alta criticidade.
Salário: 11.359,00 + VT +  VR 
Horário: Segunda a sexta-feira das 10h às 19h
Local: Casa Verde - Zona Norte