Categorías
···
Entrar / Registro

Entrenador de IA italiano - Trabajo remoto

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
México, 01000, MX
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto implica realizar actividades de equipo rojo sobre modelos de IA conversacional para descubrir vulnerabilidades y generar datos humanos de alta calidad que hagan la IA más segura. Aspectos destacados: 1. Probar modelos de IA con entradas adversarias para identificar vulnerabilidades 2. Generar datos humanos de alta calidad mediante la anotación de fallos y la clasificación de riesgos 3. Aplicar pruebas estructuradas para garantizar resultados consistentes y reproducibles **Ubicación**: Remota **Tipo**: Contrato a tiempo completo o parcial **Conocimientos lingüísticos fluidos requeridos**: inglés y italiano. Se exige fluidez nativa en inglés e italiano para este puesto. **Motivo de existencia de este puesto** Creemos que la IA más segura es aquella que ya ha sido atacada… por nosotros. Estamos conformando un equipo rojo para este proyecto: expertos humanos en datos que prueban modelos de IA con entradas adversarias, identifican vulnerabilidades y generan los datos del equipo rojo que hacen la IA más segura para nuestros clientes. Este proyecto implica revisar salidas de IA que abordan temas sensibles, como sesgos, desinformación o comportamientos dañinos. Todo el trabajo es basado en texto, y la participación en proyectos de mayor sensibilidad es opcional y está respaldada por directrices claras y recursos de bienestar. Antes de acceder a cualquier contenido, se comunicarán claramente los temas correspondientes. **Sus responsabilidades** * Realizar actividades de equipo rojo sobre modelos y agentes de IA conversacional: intentos de evasión (jailbreaks), inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación en múltiples turnos * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos para mantener la coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil ideal** * Tener experiencia previa en actividades de equipo rojo (trabajo adversario con IA, ciberseguridad, exploración socio-técnica) * Ser curioso y tener mentalidad adversaria: impulsar instintivamente los sistemas hasta sus límites de resistencia * Ser estructurado: utilizar marcos metodológicos o referencias comparativas (benchmarks), no solo ataques aleatorios * Ser comunicativo: explicar claramente los riesgos tanto a partes interesadas técnicas como no técnicas * Ser adaptable: prosperar al cambiar entre distintos proyectos y clientes **Especialidades deseables (no obligatorias)** * Aprendizaje automático adversario: conjuntos de datos para intentos de evasión (jailbreak), inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgo socio-técnico: exploración de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Exploración creativa: psicología, interpretación teatral, redacción para un pensamiento adversario poco convencional **Indicadores de éxito** * Identificar vulnerabilidades que las pruebas automatizadas pasan por alto * Entregar artefactos reproducibles que fortalezcan los sistemas de IA de los clientes * Ampliar la cobertura de evaluación: probar más escenarios y reducir sorpresas en producción

Fuentea:  indeed Ver publicación original
Juan García
Indeed · HR

Compañía

Indeed
Juan García
Indeed · HR

Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.