Entrenador de IA italiano - Teletrabajo

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Mexico

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto implica realizar pruebas de equipo rojo sobre modelos de IA conversacional para identificar vulnerabilidades y generar datos que hagan la IA más segura para los clientes, centrándose en temas sensibles como el sesgo y la desinformación. Aspectos destacados: 1. Realizar pruebas de equipo rojo sobre modelos y agentes de IA conversacional para descubrir vulnerabilidades 2. Generar datos humanos de alta calidad para fortalecer los sistemas de IA 3. Contribuir a hacer la IA más segura identificando y abordando riesgos **Ubicación**: Teletrabajo **Tipo**: Trabajo por contrato a tiempo completo o parcial **Conocimientos lingüísticos fluidos requeridos**: inglés e italiano. Se exige fluidez nativa en inglés e italiano para este puesto. **Motivo de existencia de este puesto** Creemos que la IA más segura es aquella que ya ha sido atacada… por nosotros. Estamos formando un equipo rojo para este proyecto: expertos humanos en datos que someten a prueba los modelos de IA con entradas adversarias, identifican vulnerabilidades y generan los datos del equipo rojo que hacen la IA más segura para nuestros clientes. Este proyecto implica revisar las salidas de la IA que tratan temas sensibles como el sesgo, la desinformación o comportamientos perjudiciales. Todo el trabajo es textual, y la participación en proyectos de mayor sensibilidad es opcional y cuenta con pautas claras y recursos de bienestar. Antes de estar expuesto a cualquier contenido, se comunicarán claramente los temas correspondientes. **Sus responsabilidades** * Realizar pruebas de equipo rojo sobre modelos y agentes de IA conversacional: intentos de evasión (jailbreaks), inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación multivuelta * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos para mantener la coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil del candidato** * Posee experiencia previa en pruebas de equipo rojo (trabajo adversario con IA, ciberseguridad, análisis socio-técnico) * Es curioso y adversario: instintivamente lleva los sistemas hasta sus límites * Es estructurado: utiliza marcos metodológicos o referencias comparativas (benchmarks), no solo ataques aleatorios * Es comunicativo: explica los riesgos con claridad tanto a partes interesadas técnicas como no técnicas * Es adaptable: prospera al moverse entre distintos proyectos y clientes **Especialidades deseables (no obligatorias)** * Aprendizaje automático adversario: conjuntos de datos para intentos de evasión (jailbreak), inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgo socio-técnico: análisis de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Exploración creativa: psicología, interpretación teatral, redacción para un pensamiento adversario poco convencional **Indicadores de éxito** * Identifica vulnerabilidades que las pruebas automatizadas pasan por alto * Entrega artefactos reproducibles que fortalecen los sistemas de IA de los clientes * Ampliación de la cobertura de evaluación: se prueban más escenarios y surgen menos sorpresas en producción

Fuentea: indeed Ver publicación original