




**Información importante:** * Años de experiencia: 5\+ años * Modalidad del puesto: Tiempo completo * Modalidad de trabajo: Teletrabajo dentro de México **Resumen del puesto:** Buscamos un Ingeniero de Confiabilidad del Sitio (19324\) para garantizar la confiabilidad, escalabilidad y rendimiento de plataformas personalizadas que operan sobre infraestructura de AWS y Kubernetes. Este puesto se centra en la resolución de incidencias de nivel 3, la preparación operativa para nuevos lanzamientos y las mejoras proactivas de la estabilidad de la plataforma y la experiencia del cliente mediante las mejores prácticas de SRE. **Responsabilidades y funciones:** Diagnosticar y resolver incidencias de nivel 3 en plataformas basadas en AWS. Colaborar estrechamente con los equipos de ingeniería para preparar a Operaciones ante nuevos lanzamientos y mejoras de funcionalidades. Identificar incidencias recurrentes e implementar automatización, herramientas o mejoras de procesos para evitar su repetición. Diseñar e implementar estrategias para mejorar la confiabilidad, escalabilidad y rendimiento de la plataforma. Supervisar la salud del sistema e identificar de forma proactiva riesgos o degradaciones. Participar en la respuesta a incidencias, el análisis de causas raíz y las revisiones posteriores a incidencias. Contribuir a la documentación operativa, los manuales de procedimientos y los planes de preparación. Trabajar con partes interesadas internas para mejorar continuamente la experiencia del cliente y la robustez de la plataforma. **Cualificaciones y habilidades:** Experiencia práctica en el soporte y operación de entornos en la nube de AWS. Conocimientos sólidos de Kubernetes y conceptos de orquestación de contenedores. Competencia en Python o Go para automatización y scripting. Experiencia en soporte de plataformas, diagnóstico de fallas y optimización de rendimiento. Conocimiento de pipelines de CI/CD, herramientas de monitoreo y observabilidad. Capacidad sobresaliente para resolver problemas con una mentalidad centrada en la ingeniería. **Requisitos específicos del puesto:** Capacidad para gestionar incidencias complejas en producción y llevarlas hasta su resolución. Experiencia trabajando estrechamente con equipos de desarrollo en materia de preparación operativa. Capacidad comprobada para identificar problemas sistémicos e implementar soluciones a largo plazo. Comprensión de los principios de SRE, gestión de incidencias y métricas de confiabilidad. **Tecnologías:** AWS, Kubernetes, Docker, Python, Go, pipelines de CI/CD, herramientas de monitoreo y observabilidad, Terraform o CloudFormation (preferible) **Competencias técnicas:** Gestión de infraestructura en la nube, orquestación de contenedores, automatización y scripting, respuesta a incidencias, análisis de causas raíz, ingeniería de confiabilidad, colaboración entre equipos, documentación y excelencia operativa **Acerca de Encora:** Encora es el socio preferido de ingeniería digital y modernización de algunas de las empresas líderes mundiales y compañías nativas digitales. Con más de 9.000 expertos en 47\+ oficinas y laboratorios de innovación en todo el mundo, las prácticas tecnológicas de Encora incluyen Ingeniería y Desarrollo de Productos, Servicios en la Nube, Ingeniería de Calidad, DevSecOps, Datos y Analítica, Experiencia Digital, Ciberseguridad e Ingeniería de IA y LLM. En Encora contratamos profesionales únicamente en función de sus habilidades y calificaciones, sin discriminación por edad, discapacidad, religión, género, orientación sexual, situación socioeconómica ni nacionalidad.


