Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para construir y optimizar plataformas Kubernetes y Linux listas para GPU, automatizando la orquestación de cargas de trabajo de IA e investigación. Aspectos destacados: 1. Construir y optimizar plataformas Kubernetes y Linux listas para GPU 2. Automatizar la orquestación de cargas de trabajo de IA e investigación 3. Colaborar en la eficiencia de la programación, la capacidad y los flujos de trabajo de los investigadores Estamos construyendo plataformas Kubernetes y Linux robustas listas para GPU y necesitamos un Ingeniero Senior de DevOps para automatizar, escalar y optimizar la orquestación. Usted gestionará la administración de Kubernetes con la programación Volcano, cuotas y aislamiento, además de automatizar mediante Python y Bash cargas de trabajo de IA e investigación. Únase a nuestro equipo de entrega y postúlese hoy mismo **Responsabilidades** * Implementar, configurar y mantener clústeres Kubernetes habilitados para GPU y entornos informáticos Linux independientes para garantizar una programación y rendimiento óptimos * Implementar y operar la programación de trabajos Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Administrar Kubernetes de extremo a extremo, cubriendo espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Desarrollar y mantener automatizaciones en Python y Shell para simplificar el envío de trabajos, el aprovisionamiento de recursos y los informes del sistema * Colaborar con los equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de la capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y el uso de los recursos, proporcionando datos y retroalimentación para los requisitos de optimización e informes * Identificar y proponer mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para incrementar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan a los investigadores una experiencia fluida y eficiente en diversas cargas de trabajo de IA y computacionales **Requisitos** * Al menos 3 años de experiencia en DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Competencias expertas en la administración de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de trabajos GPU, incluida la configuración de colas y la priorización de cargas de trabajo con integración en Kubernetes * Capacidad demostrada para operar entornos de clústeres GPU en Kubernetes, así como en nodos informáticos Linux independientes * Conocimientos avanzados de scripting en Python para la automatización de infraestructura, además de habilidades en scripting UNIX Shell como Bash * Sólidas capacidades de administración de sistemas Linux, incluida la resolución de problemas, la optimización del rendimiento y la gestión de la configuración * Comprensión sólida de los conceptos y herramientas de automatización y orquestación de infraestructura * Dominio fluido del inglés (hablado y escrito) para la interacción directa con clientes **Deseable** * Conocimientos sobre la gestión de paquetes Helm para aplicaciones Kubernetes * Familiaridad con soluciones de supervisión y observabilidad, especialmente Prometheus, Grafana y Loki * Habilidades en herramientas de Infraestructura como Código (IaC), como Terraform * Experiencia en entornos Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos sobre redes Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de codificación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Experiencia en la programación y optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Juan García
Indeed · HR

Compañía

Indeed
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.