




Resumen: Este puesto es para un ingeniero de datos senior que contribuirá a construir bases de datos confiables y reforzará la forma en que los modelos de IA razonan sobre escenarios complejos de ingeniería de datos. Aspectos destacados: 1. Contribuir directamente a la próxima generación de sistemas de inteligencia artificial 2. Definir los estándares de comunicación de la IA y evaluar el contenido generado por IA 3. Diseñar, construir y mantener canalizaciones de datos de nivel productivo **Tipo de empleo:** Contratista **Ubicación:** Remota ### **Descripción del puesto** Si eres un ingeniero de datos senior que destaca por su precisión, pensamiento sistémico y capacidad para construir bases de datos confiables, esta es una oportunidad única para contribuir directamente a cómo la próxima generación de sistemas de IA razona acerca de la infraestructura de datos, las canalizaciones y los flujos de trabajo analíticos. Buscamos ingenieros de datos experimentados que comprendan las pilas modernas de datos, la arquitectura ETL/ELT, la orquestación, la modelización de datos, el diseño de almacenes de datos, la validación de calidad, la gobernanza y la fiabilidad a escala productiva. Tu trabajo ayudará a reforzar la forma en que los modelos de IA razonan sobre escenarios complejos de ingeniería de datos, identifican errores técnicos y comunican claramente las orientaciones de implementación. ### **Tu perfil** * 4\+ años de experiencia profesional en ingeniería de datos, con una participación significativa y práctica en el diseño, construcción y mantenimiento de canalizaciones de datos de nivel productivo. * Conocimientos profundos de SQL, modelización de datos, arquitectura ETL/ELT, marcos de orquestación, patrones de almacén de datos/lakehouse y herramientas modernas de la pila de datos, como dbt, Airflow, Snowflake, BigQuery, Databricks, Fivetran o plataformas similares. * Comprensión sólida de sistemas distribuidos de datos, flujos de trabajo por lotes y en tiempo real, diseño de esquemas, validación de datos, observabilidad de datos, trazabilidad y fiabilidad de canalizaciones. * Experiencia comprobada en la optimización de consultas SQL complejas, solución de problemas de calidad de datos, diseño de transformaciones escalables y soporte de conjuntos de datos listos para análisis o aprendizaje automático. * Experiencia demostrada en traducir requisitos comerciales o técnicos ambiguos en modelos de datos confiables, diseños de canalizaciones y planes de implementación. * Título universitario en Ciencias de la Computación, Ingeniería de Datos, Sistemas de Información, Estadística, Ingeniería o un campo técnico relacionado; también se considerará una experiencia profesional equivalente. * Una ventaja importante es contar con experiencia previa en entrenamiento de datos para IA, anotación o evaluación de contenido técnico generado por IA. ### **Responsabilidades clave** * Evaluar las respuestas generadas por IA a preguntas de ingeniería de datos en cuanto a precisión técnica, integridad, claridad y viabilidad en el mundo real. * Plantear desafíos a modelos avanzados de lenguaje mediante escenarios complejos de ingeniería de datos que involucren SQL, Python, diseño ETL/ELT, orquestación, almacenamiento de datos, modelización de datos y fiabilidad de canalizaciones. * Revisar y perfeccionar las preguntas, respuestas, rúbricas y respuestas de referencia generadas por IA para garantizar que reflejen el criterio de un ingeniero de datos senior. * Proporcionar comentarios estructurados que identifiquen suposiciones incorrectas, restricciones omitidas, razonamientos deficientes, implementaciones ineficientes o recomendaciones inseguras. * Definir los estándares de comunicación de la IA ayudando a los modelos a explicar clara y responsablemente la arquitectura de datos, los pasos para depurar, los compromisos y los patrones de implementación. * Apoyar los esfuerzos de evaluación comparativa al valorar el rendimiento de los modelos en flujos de trabajo realistas de ingeniería de datos, casos límite y modos de fallo. * Desarrollar y revisar ejemplos de alta calidad que demuestren un razonamiento sólido sobre el diseño de canalizaciones, las comprobaciones de calidad de datos, los contratos de datos, la evolución de esquemas y la escalabilidad del sistema.


