




Resumen: Buscamos investigadores experimentados y expertos técnicos para diseñar y validar tareas de evaluación desafiantes en diversos campos de STEM con el fin de evaluar modelos punteros. Aspectos destacados: 1. Diseñar problemas desafiantes de STEM del mundo real 2. Puesto completamente remoto con horarios flexibles 3. Implementar tareas utilizando Python Buscamos **investigadores experimentados y expertos técnicos** para apoyar un proyecto de evaluación de modelos punteros centrado en flujos de trabajo basados en agentes. Usted diseñará y validará tareas de evaluación desafiantes en **ciencia de datos, aprendizaje automático, finanzas y programación**, con el fin de identificar brechas en el razonamiento y la resolución de problemas de modelos avanzados de STEM. La función implica crear tareas del mundo real con pruebas ejecutables y analizar el comportamiento de los modelos o agentes. **Responsabilidades clave** ------------------------ * Diseñar problemas desafiantes de STEM del mundo real * Implementar cada tarea dentro de un entorno de desarrollo basado en agentes utilizando **Python** **Términos contractuales y de pago** ------------------------------ + Usted será contratado como contratista independiente. + Se trata de un puesto completamente remoto que puede realizarse según su propio horario. + Los proyectos pueden ampliarse, acortarse o finalizarse anticipadamente según las necesidades y el desempeño. + Los pagos se realizan semanalmente mediante Stripe o Wise, basados en los servicios prestados.


