




Resumen: Buscamos un Ingeniero Senior de Confiabilidad del Sitio (SRE) para unirse a un equipo central de ingeniería, encargado de garantizar la disponibilidad, latencia y rendimiento de la plataforma mediante un enfoque de ingeniería de software para las operaciones. Aspectos destacados: 1. Desarrollo de soluciones innovadoras de software que generan impacto 2. Entorno colaborativo e inclusivo en el que sus ideas importan 3. La automatización es la opción predeterminada y la intervención manual es un recurso de último recurso **Descripción de la empresa** En KMS Technology México, nos apasiona desarrollar soluciones innovadoras de software que generan impacto. Como parte de una empresa tecnológica internacional, ofrecemos un entorno colaborativo e inclusivo en el que sus ideas importan y su crecimiento es nuestra prioridad. **Descripción del puesto** Buscamos un Ingeniero Senior de Confiabilidad del Sitio (SRE) para unirse a nuestro equipo central de ingeniería en el desarrollo de la próxima generación de inteligencia inmobiliaria impulsada por IA para la industria de seguros. En este puesto, usted será el responsable de la disponibilidad, latencia y rendimiento de la plataforma. Usted trabajará en el corazón de un ecosistema de alta demanda, asegurando que nuestros microservicios en Node.js y nuestras canalizaciones de IA/ML ejecutadas en Google Cloud Platform (GCP) sean resilientes, escalables y seguras. Se trata de un puesto con un "enfoque de ingeniería de software para las operaciones", donde la automatización es la opción predeterminada y la intervención manual es un recurso de último recurso. **Responsabilidades clave** Infraestructura e ingeniería de plataformas * Arquitectura en la nube: Diseñar y gestionar infraestructura escalable y multi-regional en GCP, aprovechando GKE (Kubernetes), Cloud Run y Pub/Sub. * Infraestructura como código (IaC): Mantener y evolucionar nuestra base de código de infraestructura utilizando Terraform o Pulumi, garantizando la paridad entre los entornos de Pruebas y Producción. * Optimización de Node.js: Colaborar con los equipos fullstack para ajustar el rendimiento de las aplicaciones Node.js, gestionando límites de memoria, cuellos de botella en el bucle de eventos y ejecución asíncrona en un entorno contenedorizado. **Observabilidad y confiabilidad** * Definición de SLO/SLI: Definir y supervisar Indicadores de Nivel de Servicio (SLIs) y Objetivos de Nivel de Servicio (SLOs) para medir la "salud" de nuestro motor de inteligencia inmobiliaria. * Supervisión avanzada: Crear paneles integrales y sistemas de alertas mediante Google Cloud Operations Suite (Stackdriver), Prometheus o Grafana. * Gestión de incidencias: Liderar el análisis de causa raíz (RCA) de incidencias en producción e implementar "informes post-mortem sin culpabilidades" para prevenir su recurrencia. **Operaciones de IA y datos** * Integración de MLOps: Apoyar la escalabilidad de modelos de IA optimizando la utilización de GPU/TPU y las canalizaciones de ingesta de datos dentro de GCP. Seguridad y cumplimiento: Garantizar que la plataforma cumpla con los rigurosos estándares de privacidad de datos de la industria de seguros, incluyendo el cumplimiento de SOC2 y GDPR. **Requisitos** **Requisitos técnicos:** * 5 o más años de experiencia en puestos de SRE, DevOps o arquitectura de sistemas. * Experiencia avanzada en Google Cloud Platform (GCP), especialmente con GKE, IAM, Cloud SQL y redes VPC. * Competencia en programación: Amplia experiencia con Node.js (servicios backend) y scripting en Python o Go para automatización. * Orquestación: Conocimientos expertos en Kubernetes (GKE), incluidos gráficos Helm y mallas de servicios (Istio/Anthos). * CI/CD: Experiencia en la construcción de canalizaciones de despliegue de alta frecuencia con GitHub Actions, GitLab CI o Google Cloud Build. **Competencias profesionales:** * La "mentalidad SRE": Pasión por la automatización y una aversión visceral a las tareas manuales repetitivas ("Toil"). * Comunicación estratégica: Capacidad para traducir riesgos complejos de infraestructura en impacto empresarial para partes interesadas y directores de entrega. * Flujo de trabajo centrado en IA: Uso proactivo de herramientas de IA para la detección de anomalías en registros, escalado predictivo y solución automatizada de problemas. **Información adicional** **Ubicación:** Guadalajara, Jalisco, México (modalidad híbrida) **Beneficios y ventajas** ***Ventajas que disfruta en KMS México*** * Beneficios conforme a la ley mexicana * 15 días de vacaciones pagadas (en el año cero; a partir del primer año, se otorgan 3 días adicionales por año). * 5 días de licencia por fallecimiento de familiares directos, negociables. * Seguro contra gastos médicos mayores con cobertura para dependientes directos (cónyuge e hijos). * Bono anual por desempeño (10 % del salario anualizado). * Ajuste salarial anual. * Bono por referencias de empleados. * Certificaciones y cursos pagados. * Licencia de Coursera. * Fondo de ahorro del 5 %. * Vales de despensa del 5 %.


