Entrenador japonés de IA - Teletrabajo

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

México

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto implica realizar pruebas de equipo rojo (red teaming) sobre modelos de IA conversacional mediante entradas adversarias para identificar vulnerabilidades y generar datos que contribuyan a sistemas de IA más seguros. Aspectos destacados: 1. Probar modelos de IA con entradas adversarias para hacer la IA más segura 2. Revisar las salidas de la IA sobre temas sensibles con directrices claras 3. Descubrir vulnerabilidades que las pruebas automatizadas pasan por alto **Modalidad de trabajo:** Teletrabajo **Tipo de contratación:** Contratista independiente **Horario:** Contrato a tiempo completo o a tiempo parcial **Existencia del puesto** Creemos que la IA más segura es aquella que ya ha sido atacada — por nosotros. Estamos formando un equipo rojo para este proyecto: expertos humanos en datos que someten modelos de IA a entradas adversarias, identifican vulnerabilidades y generan datos de equipo rojo que hacen la IA más segura para nuestros clientes. Este proyecto implica revisar salidas de IA relacionadas con temas sensibles como sesgo, desinformación o comportamientos dañinos. Todo el trabajo es textual y la participación en proyectos de mayor sensibilidad es opcional, respaldada por directrices claras y recursos para el bienestar. Antes de exponerse a cualquier contenido, los temas serán comunicados claramente. **Sus responsabilidades** * Realizar pruebas de equipo rojo sobre modelos y agentes de IA conversacional: intentos de evasión (jailbreaks), inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación en múltiples turnos * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos (playbooks) para mantener la coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil ideal** * Posee experiencia previa en pruebas de equipo rojo (trabajo adversario con IA, ciberseguridad, análisis socio-técnico) * Es curioso y adversario: empuja instintivamente los sistemas hasta sus límites * Es estructurado: utiliza marcos metodológicos o referencias comparativas, no solo ataques aleatorios * Es comunicativo: explica los riesgos con claridad tanto a partes técnicas como no técnicas * Es adaptable: se desenvuelve con soltura al transitar entre distintos proyectos y clientes **Especialidades deseables (no obligatorias)** * Aprendizaje automático adversario: conjuntos de datos para intentos de evasión (jailbreak), inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgos socio-técnicos: análisis de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Exploración creativa: psicología, interpretación teatral, escritura para fomentar un pensamiento adversario poco convencional **Indicadores de éxito** * Identifica vulnerabilidades que las pruebas automatizadas pasan por alto * Entrega artefactos reproducibles que refuerzan los sistemas de IA de los clientes * Ampliación de la cobertura de evaluación: se prueban más escenarios y surgen menos sorpresas en producción **Términos contractuales y de pago** ------------------------------ * Será contratado como contratista independiente. * Se trata de un puesto completamente remoto que puede realizarse según su propio horario. * Los proyectos pueden ampliarse, acortarse o finalizarse anticipadamente según las necesidades y el desempeño. * Los pagos se realizan semanalmente mediante Stripe o Wise, basados en los servicios prestados.

Fuentea: indeed Ver publicación original

Juan García

Indeed · HR

Compañía

Indeed

Juan García

Indeed · HR

Empleos similares

Entrenador japonés de IA - Teletrabajo

Descripción

Compañía

Empleos similares

Chofer ejecutivo particular

Chofer Ejecutivo

Auditor Interno - Hyundai Vallejo

Pasante en Finanzas (Polanco, CDMX)

Chofer de reparto

Auditor Interno Jr - Hyundai Vallejo