




Resumen del Puesto: Buscamos un Ingeniero de Machine Learning apasionado por la optimización de algoritmos y el procesamiento de texto en español para construir una solución de IA innovadora. Puntos Destacados: 1. Rol fundacional con impacto directo en decisiones de arquitectura. 2. Entorno con alta autonomía y desafío técnico avanzado. 3. Infraestructura y hardware dedicado para entrenamiento de modelos. Estamos formando un equipo seleccionado para construir una solución tecnológica innovadora en Latinoamérica. Desarrollamos inteligencia artificial de frontera enfocada en procesamiento de texto en español, atendiendo a un problema real con clientes listos para la implementación. Si tienes pasión por la optimización de algoritmos, la depuración de código y ver cómo una curva de pérdida finalmente converge, eres la persona que buscamos. Diseñarás y ejecutarás el pipeline completo: corpus, Continual Pre-Training (CPT), Supervised Fine-Tuning (SFT), RLHF, cuantización y despliegue en hardware propietario. Ofrecemos un entorno con alta autonomía, responsabilidad y un desafío técnico avanzado. Funciones principales: Preparar y tokenizar conjuntos de datos de texto en español a gran escala. Ejecutar Continual Pre-Training sobre modelos base de código abierto en infraestructura de GPUs dedicadas. Realizar ajuste fino supervisado (Fine-tuning) con LoRA y QLoRA utilizando el ecosistema de HuggingFace y TRL. Diseñar y operar pipelines de RLHF y DPO con anotadores de dominio. Cuantizar el modelo final para despliegue local (on-premise) utilizando GGUF y MLX en hardware específico. Construir sistemas de recuperación de información (RAG) sobre pgvector. Diseñar métricas de evaluación rigurosas para la validación de los modelos. Requisitos indispensables: Dominio avanzado de Python. Experiencia práctica demostrable con PyTorch y HuggingFace Transformers. Experiencia en Fine-tuning de LLMs en entornos de producción (SFT, LoRA, QLoRA). Manejo fluido de entornos Linux mediante línea de comandos. Experiencia en gestión de grandes volúmenes de datos (procesos ETL, tokenización y pipelines). Dominio nativo u operativo avanzado (C2) del idioma español para la evaluación de textos. Requisitos deseables: Conocimiento de MLX para Apple Silicon. Experiencia con RLHF, DPO y Reward Modeling. Manejo de herramientas como Unsloth, DeepSpeed o FSDP. Conocimientos en cuantización: GGUF, GPTQ, AWQ. Experiencia con pgvector o bases de datos vectoriales. Familiaridad con llama.cpp y Ollama. Ofrecemos: Sueldo competitivo acorde a la experiencia técnica demostrada. Prestaciones superiores a las de la ley. Infraestructura y hardware dedicado para el entrenamiento de modelos. Rol fundacional con impacto directo en las decisiones de arquitectura. Flexibilidad de horario basada en el cumplimiento de objetivos. Proceso de selección: Por políticas de la plataforma, favor de postularse directamente a través del botón de este portal manteniendo actualizado tu perfil, incluyendo tu portafolio o enlaces a repositorios de código relevantes (proyectos de fine-tuning o entrenamiento) en tu información adjunta. El código demostrable será evaluado en las primeras etapas del proceso.-Requerimientos- Educación mínima: Educación superior - Especialidad 4 años de experiencia Idiomas: Español ,Inglés Edad: entre 30 y 40 años Conocimientos: Backend, Base de datos, Inteligencia artificial, Java, Optimización, Python, Spring, Soluciones tecnológicas
