Categorías
···
Entrar / Registro
Ingeniero Senior DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Optimizar la orquestación basada en Kubernetes para GPU y los entornos de computación Linux, automatizando operaciones y gestionando la administración de Kubernetes y la programación con Volcano. Aspectos destacados: 1. Experto en administración y orquestación de Kubernetes 2. Experiencia práctica con el programador Volcano para cargas de trabajo GPU 3. Programación avanzada en Python y UNIX Shell para automatización Estamos optimizando la orquestación basada en Kubernetes para GPU y los entornos de computación Linux, y un Ingeniero Senior DevOps ayudará a automatizar y reforzar las operaciones a gran escala. Usted gestionará la administración de Kubernetes y la programación con Volcano, hará cumplir las cuotas de recursos y desarrollará automatizaciones en Python y UNIX Shell para cargas de trabajo de investigación. ¡Postúlese hoy mismo para unirse a nuestro equipo de entrega! **Responsabilidades** * Configurar, ajustar y mantener clústeres de Kubernetes habilitados para GPU y entornos de computación Linux independientes, garantizando una programación eficiente y un alto rendimiento * Implementar y gestionar flujos de trabajo de programación con Volcano, incluidas la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Administrar plataformas Kubernetes de extremo a extremo, abarcando espacios de nombres, RBAC, cuotas de recursos y estrategias de aislamiento de cargas de trabajo * Escribir y mantener scripts en Python y Shell para automatizar la presentación de trabajos, el aprovisionamiento de recursos y la generación de informes del sistema * Colaborar con los equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de recursos, y proporcionar datos para requisitos de optimización e informes * Proponer e implementar mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para potenciar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan una experiencia fluida y eficiente a los investigadores que realizan diversas cargas de trabajo de inteligencia artificial y computacionales **Requisitos** * Mínimo 3 años de experiencia profesional en DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Conocimientos expertos en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para la ejecución de cargas de trabajo GPU, incluida la configuración de colas y la priorización de cargas de trabajo integrada con Kubernetes * Experiencia demostrable en la operación de entornos de clústeres GPU sobre Kubernetes y también en nodos de computación Linux independientes * Habilidades avanzadas de programación en Python para automatización de infraestructura, además de competencia en programación en UNIX Shell, como Bash * Sólidas habilidades de administración de Linux, incluidas la resolución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión sólida de los principios y herramientas de automatización y orquestación de infraestructura * Capacidad fluida para comunicarse en inglés (hablado y escrito) en interacciones directas con clientes **Deseable** * Experiencia con Helm para la gestión de paquetes de aplicaciones en Kubernetes * Conocimientos de herramientas de observabilidad, especialmente Prometheus, Grafana y Loki * Experiencia con herramientas de Infraestructura como Código (IaC), tales como Terraform * Exposición a entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos de redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de programación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Experiencia en programación y optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Juan García
Indeed · HR

Compañía

Indeed
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.