




Buscamos ingenieros de observabilidad para ayudar a estandarizar y mejorar nuestras prácticas de observabilidad tras una importante consolidación de plataforma. Trabajarás en estrecha colaboración con los equipos internos de ingeniería y con nuestro socio de migración de proveedores para unificar la supervisión, el registro de eventos (logging) y las alertas en toda la organización. Este puesto es fundamental para construir una experiencia de observabilidad coherente y empresarial que mejore la confiabilidad, el rendimiento y la detección proactiva. Principales responsabilidades * Diseñar e implementar un panel universal en Grafana para facilitar la visibilidad de la dirección y los equipos de ingeniería. * Garantizar una apariencia y sensación uniformes en todas las vistas de observabilidad. * Definir e implementar indicadores de nivel de servicio (SLI), objetivos de nivel de servicio (SLO) y presupuestos de errores para servicios críticos. * Establecer umbrales de alerta y flujos de escalado alineados con los objetivos de confiabilidad. * Integrar la detección de anomalías y conocimientos asistidos por IA en la plataforma de observabilidad. * Contribuir a flujos de trabajo de autorreparación y estrategias automatizadas de corrección. * Colaborar con los equipos de ingeniería para instrumentar los servicios con métricas, registros (logs) y trazas (traces). * Proporcionar documentación y buenas prácticas para la adopción de la observabilidad en todos los equipos. Habilidades y experiencia requeridas * **Más de 5 años de experiencia en observabilidad, supervisión o ingeniería de confiabilidad.** * Experiencia práctica con herramientas comunes de **observabilidad**, como Prometheus, Grafana, Splunk, Coralogix y herramientas externas de supervisión (por ejemplo, Catchpoint, ThousandEyes). * **Capacidad sólida de creación de scripts en Python, además de Bash o PowerShell para automatización.** * Experiencia con Terraform y Ansible para la automatización de infraestructura. * Conocimiento sólido de SLI, SLO, presupuestos de errores y principios de ingeniería de confiabilidad. * Familiaridad con entornos Linux y sistemas distribuidos. Habilidades deseables * Conocimientos sobre detección de anomalías basada en IA/ML y plataformas AIOps. * Experiencia con canalizaciones de ingesta de registros (OpenTelemetry, Fluentd). * Conocimientos adicionales de lenguajes de programación (Python, Go, Java). * Experiencia práctica con canalizaciones en GitHub Actions \#Linkedin \#Argentina \#Mexico


