Ingeniero Senior de Confiabilidad de Sitios (SRE) - Azure

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

79Q22222+22, MX

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Buscamos un Ingeniero Senior de Confiabilidad de Sitios (SRE) – Azure para impulsar la salud, la confiabilidad y el rendimiento del servicio en entornos de alta criticidad. Aspectos destacados: 1. Aplicar prácticas avanzadas de confiabilidad en la nube en entornos de alta criticidad 2. Dirigir el análisis de causa raíz y las revisiones posteriores a incidentes 3. Capacitar a los miembros del equipo en la adopción de los principios de SRE y las herramientas de Azure Estamos buscando un **Ingeniero Senior de Confiabilidad de Sitios (SRE) – Azure** para impulsar la salud, la confiabilidad y el rendimiento del servicio mientras lanzamos y escalamos los servicios para nuestro cliente. Este rol crítico requiere experiencia en respuesta a incidentes, resolución de problemas y mejora de las prácticas de confiabilidad en la nube en entornos de alta\-criticidad con madurez procesal mínima. **Responsabilidades** * Desarrollar y automatizar procesos para mejorar la confiabilidad, escalabilidad y rendimiento del sistema * Colaborar con equipos para integrar las mejores prácticas de confiabilidad en el ciclo de vida del desarrollo de software * Responder rápidamente y resolver incidentes de servicio dentro del entorno de Azure para minimizar el tiempo de inactividad * Dirigir el análisis de causa raíz y las revisiones posteriores a incidentes, asegurando la implementación de mejoras accionables * Diseñar y mantener soluciones robustas de supervisión, alertas y observabilidad para servicios críticos * Identificar proactivamente riesgos de confiabilidad y abordarlos antes de que afecten a los clientes * Establecer y perfeccionar prácticas de SRE, como la gestión de incidentes y los objetivos de nivel de servicio (SLO) * Capacitar a los miembros del equipo en la adopción de los principios de SRE y el uso de las herramientas de Azure * Analizar incidentes y interrupciones recurrentes para impulsar mejoras sistémicas * Promover una cultura de confiabilidad y aprendizaje continuo **Requisitos** * 3\+ años de experiencia en SRE, DevOps o roles similares, con experiencia demostrada en entornos en la nube, incluido Azure * Experiencia especializada en la resolución de problemas de sistemas distribuidos, redes y arquitecturas nativas de la nube * Experiencia práctica con herramientas de Azure como Monitor, Log Analytics, Application Insights, ARM, Bicep y Terraform * Competencia en lenguajes de scripting o programación como Python, PowerShell o Bash * Conocimiento de los flujos de trabajo de gestión de incidentes y las evaluaciones posteriores a incidentes * Experiencia en la implementación de soluciones de observabilidad y la definición de indicadores de nivel de servicio (SLI) * Excelentes habilidades comunicativas y capacidad para colaborar eficazmente bajo presión * Dominio del inglés a nivel B2 o superior **Deseable** * Demostración de experiencia en Python * Certificaciones de Azure, como Arquitecto de Soluciones de Azure o Ingeniero de DevOps de Azure * Experiencia previa en la creación de prácticas de SRE en entornos con baja madurez procesal * Conocimiento de pipelines de CI/CD e infraestructura como código * Experiencia en la capacitación o liderazgo de equipos de SRE/DevOps

Fuentea: indeed Ver publicación original