




Resumen: Buscamos un Ingeniero Principal de Fiabilidad de Sitio para liderar la fiabilidad, escalabilidad y rendimiento de una plataforma de inteligencia inmobiliaria impulsada por IA, actuando como puente entre la inferencia de modelos de IA y la estabilidad empresarial. Aspectos destacados: 1. Liderar la fiabilidad, escalabilidad y rendimiento de una plataforma impulsada por IA 2. Conectar la inferencia compleja de modelos de IA con la estabilidad empresarial 3. Mentorizar a ingenieros y colaborar con Directores Senior de Entrega **Descripción de la empresa** En KMS Technology, estamos dedicados a ofrecer soluciones y servicios de vanguardia que permiten a las empresas alcanzar sus objetivos. Nuestro equipo está compuesto por profesionales altamente calificados apasionados por la tecnología y la innovación. Ofrecemos un entorno laboral dinámico y colaborativo donde puedes desarrollar tu carrera y generar un impacto significativo. **Descripción del puesto** Buscamos un **Ingeniero Principal de Fiabilidad de Sitio** para liderar la fiabilidad, escalabilidad y rendimiento de nuestra plataforma de inteligencia inmobiliaria impulsada por IA. Operando en la intersección de la IA geoespacial y la tecnología aseguradora, serás responsable de un ecosistema crítico en **Azure** que soporta microservicios de alto rendimiento en **Java**. Como líder, cerrarás la brecha entre la inferencia compleja de modelos de IA y la estabilidad empresarial. Asumirás el mandato de «Excelencia en Producción», mentorizando a un equipo de ingenieros y colaborando con Directores Senior de Entrega para garantizar que nuestra infraestructura global se mantenga a la vanguardia de nuestro crecimiento acelerado. **Responsabilidades clave** **Liderazgo estratégico de infraestructura y Azure** * **Arquitectura en la nube:** Liderar el diseño de arquitecturas altamente disponibles y multi-región en **Azure**, utilizando AKS (Azure Kubernetes Service), Azure Functions y Service Bus. * **Gobernanza de IaC:** Establecer y hacer cumplir estándares para Infraestructura como Código mediante **Terraform** o Bicep, garantizando un aprovisionamiento automatizado al 100 % en todos los entornos. * **Ingeniería de rendimiento Java:** Colaborar con equipos de backend para optimizar el rendimiento de la **JVM**, ajuste de la recolección de basura y gestión de memoria para procesamiento asegurador de alta concurrencia. **Fiabilidad y operaciones de IA (AIOps)** * **Presupuesto de errores:** Definir, negociar y gestionar **SLI, SLO y SLA** con los interesados del producto, equilibrando la velocidad de lanzamiento de funciones de IA con la estabilidad del sistema. * **Observabilidad avanzada:** Diseñar monitoreo integral y trazado distribuido mediante **Azure Monitor, Application Insights** y ELK/Grafana. * **Comandante de incidentes:** Actuar como punto final de escalación para incidentes de alta prioridad, liderando análisis profundos de causa raíz (RCA) y conduciendo tareas de corrección a largo plazo. **Seguridad y cumplimiento normativo del sector** * **Soberanía de datos:** Garantizar que la plataforma cumpla con los requisitos específicos de residencia de datos del sector asegurador y los marcos de seguridad (SOC2, HIPAA o ISO 27001\). * **Gobernanza automatizada:** Implementar Azure Policy y escaneos de seguridad automatizados dentro de las canalizaciones CI/CD para asegurar una infraestructura «segura por diseño». **Requisitos** **Liderazgo técnico:** * **7\+ años** de experiencia en SRE, DevOps o Ingeniería en la nube, con al menos **2 años en un rol de liderazgo o principal.** * **Dominio de Azure:** Conocimiento experto del Marco Bien Arquitectado de Azure, especialmente en redes (VNet/ExpressRoute) y computación. * **Ecosistema Java:** Profunda competencia en la pila **Java/Spring Boot** desde una perspectiva operativa (perfilado de JVM, análisis de volcados de hilos). * **Orquestación de contenedores:** Dominio experto de **Kubernetes (AKS)**, incluidos controladores de ingreso, malla de servicios (Istio) y seguridad de clústeres. **Competencias profesionales:** * **Mentalidad estratégica:** Capacidad para traducir la deuda técnica y los riesgos de fiabilidad en un caso de negocio basado en datos para la dirección. * **Defensor de la automatización:** Historial comprobado de eliminación de «trabajo repetitivo» mediante herramientas de automatización basadas en Python, Go o Java. * **Mentoría:** Pasión por elevar la organización de ingeniería mediante talleres, documentación y programación en pareja. * **Integración centrada en IA:** Experiencia aprovechando la IA para escalado predictivo y resúmenes automáticos de registros con el fin de reducir el tiempo medio de recuperación (MTTR). **Información adicional** ***Beneficios que disfrutarás en KMS******México*** * Beneficios conforme a la ley mexicana * 15 días de vacaciones pagadas (en el año cero; a partir del primer año son 3 días por año). * 5 días de licencia por fallecimiento de familiares directos, negociables. * Seguro contra gastos médicos mayores con cobertura para dependientes directos (cónyuge e hijos). * Bono anual por desempeño (10 % del salario anualizado). * Ajuste salarial anual. * Bono por referidos de empleados. * Certificaciones / cursos pagados. * Licencia de Coursera. * Fondo de ahorro del 5 %. * Vales de despensa del 5 %.


