Cloud NOC Engineer - MX

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Isabel La Católica 5, Centro Histórico de la Cdad. de México, Centro, Cuauhtémoc, 06000 Ciudad de México, CDMX, Mexico

Favoritos

Descripción

Resumen del Puesto: Buscamos un Cloud NOC Engineer para monitorear proactivamente la salud de los centros de datos, gestionar incidentes y asegurar la continuidad de operaciones críticas. Puntos Destacados: 1. Monitoreo proactivo 24/7 de infraestructura crítica 2. Gestión integral de incidentes y escalamiento técnico 3. Uso de herramientas avanzadas de monitoreo y observabilidad ### **Resumen** Whitestack despliega nubes privadas en distintas capitales de Latinoamérica. En cada uno de estos sitios opera decenas o incluso cientos de servidores, interconectados mediante redes de alta velocidad y diseñados para soportar aplicaciones de misión crítica incluyendo el tráfico de voz de operadores móviles, lo que exige niveles de disponibilidad cercanos al 99,999%. Por esta razón estamos buscando a los mejores ingenieros para su área de *Cloud Support*, puestos de gran relevancia para garantizar la continuidad de la operación de grandes centros de datos, los que soportan las aplicaciones e infraestructura de telecomunicaciones críticas e ininterrumpidas que desplegamos. El **Cloud NOC Engineer** es el guardián de esta infraestructura. Su misión es el monitoreo proactivo 24/7 de la salud de los centros de datos, detectando anomalías antes de que afecten el servicio. Es el primer frente de respuesta, encargado de la gestión integral de incidentes: desde la detección y apertura de tickets hasta la resolución de fallas de complejidad baja/media y el escalamiento técnico estructurado hacia los niveles L1/L2\. **Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú.** **Shifts disponibles: México, Colombia, Perú desde la 1PM. / Argentina, Chile, Uruguay desde las 8AM.** ### **Responsabilidades** * Monitoreo Proactivo: Vigilancia constante de dashboards y alertas (infraestructura física, virtual y servicios) para garantizar la disponibilidad del 99,999%. * Gestión de Incidentes (Triage): Recepción, categorización y priorización de alertas. Apertura y seguimiento riguroso de tickets bajo metodologías ITIL. * Resolución Técnica Inicial: Diagnóstico y resolución de fallas de complejidad baja y media (ej. reinicio de servicios, limpieza de logs, ajustes de cuotas, verificación de conectividad básica). * Escalamiento Estructurado: Cuando la complejidad supera el nivel inicial, escalar a L1/L2 entregando un reporte técnico completo (logs, trazas de red, pasos de reproducción y contexto del cliente). * Documentación de Casos: Mantener actualizada la bitácora de eventos y la base de conocimientos (KB) sobre incidentes recurrentes. * Comunicación Externa: Notificar a los clientes sobre estados de salud, ventanas de mantenimiento e incidentes en curso de forma clara y oportuna. * Health Checks: Ejecución de rutinas periódicas de validación de salud en plataformas productivas. * Velar por el cumplimiento de SLA de incidencias y disponibilidad de red y servicios * Generación y análisis de reportes de disponibilidad de las plataformas ### **Requerimientos** * Experiencia: + Al menos 1\-2 años en centros de monitoreo (NOC), soporte técnico de primer nivel o administración de sistemas. + Experiencia en manejo de tickets y procesos de soporte (Jira, ServiceNow u otros), incluyendo documentación clara de diagnóstico, evidencias y comunicación. + Experiencia en manejo de herramientas de Monitoreo/Observabilidad como Prometheus, Grafana, Elasticsearch, Opensearch, OpenNMS. Lectura e interpretación de métricas, eventos, logs, alarmas. + Experiencia en sistemas productivos de misión crítica, incluyendo gestión de incidentes, coordinación de acciones en producción, escalamiento y comunicación efectiva. * Formación: + Ingeniería Informática, Ingeniería de Sistemas, Ingeniería Electrónica, o afín. * Conocimientos Específicos / Requisitos Técnicos: + Linux en entornos productivos: troubleshooting de servicios y sistema operativo (systemd, journalctl), permisos/usuarios, procesos, filesystem y redes. + Networking en Linux: configuración y diagnóstico de interfaces, VLANs, rutas, bonding y MTU; troubleshooting con herramientas como tcpdump (sniffing), ip, ss, ethtool, ping/traceroute + Kubernetes: operación/administración y troubleshooting en producción (Pods, Deployments/DaemonSets, Services, eventos/logs, readiness/liveness; nociones de storage PV/PVC). + Virtualización: experiencia operando y dando soporte a entornos virtualizados (KVM/VMware/Hyper\-V u otros), incluyendo diagnóstico de fallas comunes de cómputo, red y almacenamiento. + Automatización: capacidad para resolver tareas repetibles mediante Bash y Ansible y/o Python (recolección de información, checks operativos, remediación básica, scripts seguros para producción). + Inglés intermedio para leer/escribir documentación técnica, realizar actualizaciones a stakeholders e interactuar con proveedores/fabricantes ante casos de soporte. * Requisitos Profesionales + Autonomía (para lograr los mejores resultados) + Adherencia a estándares de clase mundial + Orientación al objetivo. + Apertura de aprender nuevas tecnologías + Pensamiento analítico + Trabajo en equipo (para coordinar con equipos de desarrollo y despliegue de productos) + Rápida adaptación a un entorno altamente dinámico * Requisitos Deseables Técnicos + Experiencia en OpenStack (operación, troubleshooting o administración) y/o KVM + Conocimientos del modelo de operación de una red Fija o Móvil. + Experiencia integrando y operando proyectos de código abierto en ambientes productivos. + Networking intermedio: BGP, EVPN\-VXLAN, etc. + Certificaciones: Linux, OpenStack, Kubernetes Administrator (CKA u otras). + Cursos en Ansible y/o Bash scripting. + Conocimientos en ITIL (Gestión de Incidentes, Requerimientos, Problemas, Cambios) y/o Scrum. #### **Sobre nosotros** **Whitestack** es una empresa líder en Latinoamérica especializada en soluciones en la nube e infraestructura digital híper\-escalable. Trabajamos con tecnología de código abierto y los más altos estándares de la industria para impulsar la transformación digital en toda la región. Somos un **Great Place to Work**, donde la innovación, la colaboración y el desarrollo personal son parte de nuestra esencia. **¿Por qué unirte a Whitestack?** Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países. ️ Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito. Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología. Salud primero: Seguro médico privado para ti y tu familia. Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones. Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras. Tecnología en tus manos: Renovamos tu equipo cada 3 años... ¡y es tuyo al finalizar el período! Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos. Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo. Conexión y diversión: Presupuesto para actividades recreativas e integración. Cultura de innovación: Tus ideas importan. Promovemos la participación estratégica desde cualquier rol. Conoce más sobre nuestras prestaciones aquí.

Fuentea: indeed Ver publicación original