Ingeniero de Observabilidad – Bilingüe

Salario negociable

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Mexico

Favoritos

Nueva

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Buscamos ingenieros de observabilidad para ayudar a estandarizar y mejorar nuestras prácticas de observabilidad tras una importante consolidación de plataforma. Trabajarás en estrecha colaboración con los equipos internos de ingeniería y con nuestro socio de migración de proveedores para unificar la supervisión, el registro de eventos (logging) y las alertas en toda la organización. Este puesto es fundamental para construir una experiencia de observabilidad coherente y empresarial que mejore la confiabilidad, el rendimiento y la detección proactiva. Principales responsabilidades * Diseñar e implementar un panel universal en Grafana para facilitar la visibilidad de la dirección y los equipos de ingeniería. * Garantizar una apariencia y sensación uniformes en todas las vistas de observabilidad. * Definir e implementar indicadores de nivel de servicio (SLI), objetivos de nivel de servicio (SLO) y presupuestos de errores para servicios críticos. * Establecer umbrales de alerta y flujos de escalado alineados con los objetivos de confiabilidad. * Integrar la detección de anomalías y conocimientos asistidos por IA en la plataforma de observabilidad. * Contribuir a flujos de trabajo de autorreparación y estrategias automatizadas de corrección. * Colaborar con los equipos de ingeniería para instrumentar los servicios con métricas, registros (logs) y trazas (traces). * Proporcionar documentación y buenas prácticas para la adopción de la observabilidad en todos los equipos. Habilidades y experiencia requeridas * **Más de 5 años de experiencia en observabilidad, supervisión o ingeniería de confiabilidad.** * Experiencia práctica con herramientas comunes de **observabilidad**, como Prometheus, Grafana, Splunk, Coralogix y herramientas externas de supervisión (por ejemplo, Catchpoint, ThousandEyes). * **Capacidad sólida de creación de scripts en Python, además de Bash o PowerShell para automatización.** * Experiencia con Terraform y Ansible para la automatización de infraestructura. * Conocimiento sólido de SLI, SLO, presupuestos de errores y principios de ingeniería de confiabilidad. * Familiaridad con entornos Linux y sistemas distribuidos. Habilidades deseables * Conocimientos sobre detección de anomalías basada en IA/ML y plataformas AIOps. * Experiencia con canalizaciones de ingesta de registros (OpenTelemetry, Fluentd). * Conocimientos adicionales de lenguajes de programación (Python, Go, Java). * Experiencia práctica con canalizaciones en GitHub Actions \#Linkedin \#Argentina \#Mexico

Fuentea: indeed Ver publicación original