Ingeniero Senior de Investigación en IA, Inferencia de Modelos (100% Remoto)

Salario negociable

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Isabel La Católica 5, Centro Histórico de la Cdad. de México, Centro, Cuauhtémoc, 06000 Ciudad de México, CDMX, Mexico

Favoritos

Nueva

Parte del contenido se ha traducido automáticamenteVer original

Descripción

***Únete a Tether y da forma al futuro de las finanzas digitales*** En Tether, no solo creamos productos, estamos liderando una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas—desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos—integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando confianza en cada transacción. ***Innova con Tether*** **Tether Finance:** Nuestra suite de productos innovadores incluye el stablecoin más confiable del mundo, **USDT**, utilizado por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para minería de Bitcoin utilizando prácticas ecológicas en instalaciones modernas y geográficamente diversas. **Tether Data:** Impulsando avances en IA y tecnologías punto a punto, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación principal que redefine el intercambio seguro y privado de datos. **Tether Education**: Democratizando el acceso al aprendizaje digital de primer nivel, empoderamos a las personas para prosperar en las economías digitales y gig, impulsando el crecimiento y oportunidades globales. **Tether Evolution**: En la intersección entre tecnología y el potencial humano, estamos expandiendo los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionen de formas poderosas e inéditas. ***¿Por qué unirte a nosotros?*** Nuestro equipo es un centro global de talento, trabajando de forma remota desde todos los rincones del mundo. Si te apasiona dejar huella en el sector fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, rompiendo barreras y estableciendo nuevos estándares. Hemos crecido rápido, manteniéndonos ágiles y asegurando nuestro lugar como líderes en la industria. Si tienes excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar indicado para ti. **¿Estás listo para ser parte del futuro?** **Acerca del puesto:** Estamos buscando un Ingeniero de Modelos de IA experimentado con profundos conocimientos en desarrollo de kernels, optimización de modelos, ajuste fino y aceleración GPU. El ingeniero ampliará el marco de inferencia para soportar inferencia y ajuste fino de modelos de lenguaje con fuerte enfoque en dispositivos móviles y aceleración GPU integrada (Vulkan). Este puesto requiere experiencia práctica con técnicas de cuantización, arquitecturas LoRA, backend Vulkan y depuración de GPU móvil. Desempeñarás un papel clave al expandir los límites del rendimiento de inferencia y ajuste fino en escritorio y en dispositivos para SLM/LLM de próxima generación. **Responsabilidades**: * Implementar y optimizar kernels personalizados de inferencia y ajuste fino para modelos de lenguaje pequeños y grandes en múltiples backends de hardware. * Implementar y optimizar ajuste fino completo y LoRA para modelos de lenguaje pequeños y grandes en múltiples backends de hardware. * Diseñar y extender el soporte de tipos de datos y precisión (enteros, flotantes, precisión mixta, QTypes ternarios, etc.). * Diseñar, personalizar y optimizar shaders de cómputo Vulkan para operadores cuantizados y flujos de trabajo de ajuste fino. * Investigar y resolver problemas de aceleración GPU en Vulkan y GPUs integradas/móviles. * Diseñar y preparar soporte para técnicas avanzadas de cuantización para mejorar eficiencia y uso de memoria. * Depurar y optimizar operadores GPU (por ejemplo, int8, fp16, fp4, ternario). * Integrar y validar flujos de trabajo de cuantización para entrenamiento e inferencia. * Realizar evaluaciones y pruebas de referencia (por ejemplo, pruebas de perplejidad, rendimiento de adaptadores ajustados finamente). * Realizar pruebas GPU en dispositivos de escritorio y móviles. * Colaborar con equipos de investigación e ingeniería para prototipar, evaluar y escalar nuevos métodos de optimización de modelos. * Entregar despliegues de modelos de lenguaje eficientes y listos para producción en casos de uso móvil y edge. * Trabajar estrechamente con equipos multifuncionales para integrar marcos optimizados de servicio e inferencia en pipelines de producción diseñados para aplicaciones edge y en dispositivo. Definir métricas claras de éxito como mejor rendimiento en el mundo real, bajos índices de error, escalabilidad robusta, uso óptimo de memoria y garantizar monitoreo continuo y refinamientos iterativos para mejoras sostenidas. * Dominio de C\+\+ y programación de kernels GPU. * Experiencia comprobada en aceleración GPU con el framework Vulkan. * Sólida formación en cuantización y optimización de modelos con precisión mixta. * Experiencia y dominio en desarrollo y personalización de shaders de cómputo Vulkan. * Conocimiento de ajuste fino LoRA y métodos de entrenamiento eficientes en parámetros. * Capacidad para depurar problemas específicos de rendimiento y estabilidad GPU en dispositivos de escritorio y móviles. * Experiencia práctica en aceleración GPU móvil e inferencia de modelos. * Familiaridad con arquitecturas de grandes modelos de lenguaje (por ejemplo, Qwen, Gemma, LLaMA, Falcon, etc.). * Experiencia implementando operadores personalizados hacia atrás para ajuste fino. * Experiencia creando y curando conjuntos de datos personalizados para transferencia de estilo y ajuste fino específico por dominio. * Demostrada capacidad para aplicar investigación empírica para superar desafíos en modelos **Información importante para candidatos** Los fraudes de reclutamiento se han vuelto cada vez más comunes. Para protegerte, ten en cuenta lo siguiente al postularte a vacantes: * **Postúlate únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para contratación a menos que se indique claramente. Todas las vacantes abiertas están publicadas en nuestra página oficial de empleos: https://tether.recruitee.com/ * **Verifica la identidad del reclutador.** Todos nuestros reclutadores tienen perfiles de LinkedIn verificados. Si tienes dudas, puedes confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Ten cuidado con métodos inusuales de comunicación.** No realizamos entrevistas por WhatsApp, Telegram o SMS. Toda comunicación se realiza mediante correos electrónicos oficiales de la empresa y plataformas autorizadas. * **Verifica detalladamente las direcciones de correo.** Toda comunicación proveniente de nosotros tendrá un correo que finalice en **@**tether.to **o @**tether.io * **Nunca solicitaremos pago ni datos financieros.** Si alguien solicita información financiera personal o un pago en cualquier etapa del proceso de contratación, es un fraude. Por favor, repórtalo inmediatamente. **Cuando tengas dudas, no dudes en contactarnos a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original