




Resumen: Este puesto implica construir fundamentos de datos confiables y fortalecer la forma en que los modelos de IA razonan sobre escenarios complejos de ingeniería de datos. Aspectos destacados: 1. Contribuir a cómo los sistemas de IA de próxima generación razonan sobre la infraestructura de datos 2. Evaluar y cuestionar el contenido de ingeniería de datos generado por IA 3. Dar forma a los estándares de comunicación de IA para la arquitectura de datos **Tipo de empleo:** Contratista **Ubicación:** Remota ### **Descripción del puesto** Si eres un ingeniero de datos senior que destaca por su precisión, pensamiento sistémico y capacidad para construir fundamentos de datos confiables, esta es una oportunidad única para contribuir directamente a cómo la próxima generación de sistemas de IA razona sobre la infraestructura de datos, las canalizaciones y los flujos de trabajo analíticos. Buscamos ingenieros de datos experimentados que comprendan las pilas modernas de datos, la arquitectura ETL/ELT, la orquestación, la modelización de datos, el diseño de almacenes de datos, la validación de calidad, la gobernanza y la fiabilidad a escala productiva. Tu trabajo ayudará a fortalecer la forma en que los modelos de IA razonan sobre escenarios complejos de ingeniería de datos, identifican errores técnicos y comunican claramente las orientaciones de implementación. ### **Tu perfil** * 4\+ años de experiencia profesional en ingeniería de datos, con trabajo práctico significativo en el diseño, construcción y mantenimiento de canalizaciones de datos de grado productivo. * Conocimientos profundos de SQL, modelización de datos, arquitectura ETL/ELT, marcos de orquestación, patrones de almacén/lago de datos y herramientas de la pila moderna de datos, como dbt, Airflow, Snowflake, BigQuery, Databricks, Fivetran o plataformas similares. * Buen conocimiento de los sistemas distribuidos de datos, los flujos de trabajo por lotes y en tiempo real, el diseño de esquemas, la validación de datos, la observabilidad de datos, la trazabilidad y la fiabilidad de las canalizaciones. * Experiencia comprobada en la optimización de consultas SQL complejas, la resolución de problemas de calidad de datos, el diseño de transformaciones escalables y el soporte de conjuntos de datos listos para análisis o aprendizaje automático. * Experiencia demostrada en traducir requisitos comerciales o técnicos ambiguos en modelos de datos confiables, diseños de canalizaciones y planes de implementación. * Título universitario en Ciencias de la Computación, Ingeniería de Datos, Sistemas de Información, Estadística, Ingeniería o un campo técnico relacionado; también se considerará una experiencia profesional equivalente. * Una ventaja importante es contar con experiencia previa en entrenamiento de datos para IA, anotación o evaluación de contenido técnico generado por IA. ### **Responsabilidades clave** * Evaluar las respuestas generadas por IA a indicaciones de ingeniería de datos, en cuanto a exactitud técnica, integridad, claridad y viabilidad en el mundo real. * Plantear desafíos a modelos lingüísticos avanzados mediante escenarios complejos de ingeniero de datos que involucren SQL, Python, diseño ETL/ELT, orquestación, almacenamiento de datos, modelización de datos y fiabilidad de las canalizaciones. * Revisar y perfeccionar indicaciones, respuestas, rúbricas y respuestas de referencia generadas por IA, para garantizar que reflejen el criterio de un ingeniero de datos senior. * Proporcionar comentarios estructurados que identifiquen suposiciones incorrectas, restricciones omitidas, razonamientos deficientes, implementaciones ineficientes o recomendaciones inseguras. * Dar forma a los estándares de comunicación de IA ayudando a los modelos a explicar clara y responsablemente la arquitectura de datos, los pasos para depurar, los compromisos y los patrones de implementación. * Apoyar los esfuerzos de evaluación comparativa al evaluar el rendimiento de los modelos en flujos de trabajo realistas de ingeniería de datos, casos límite y modos de fallo. * Desarrollar y revisar ejemplos de alta calidad que demuestren un razonamiento sólido sobre el diseño de canalizaciones, las comprobaciones de calidad de datos, los contratos de datos, la evolución de esquemas y la escalabilidad del sistema.


