




Descripción del puesto **Propósito del puesto** Buscamos un Científico de Datos práctico para reforzar nuestras canalizaciones analíticas que apoyan la planificación, la previsión y la optimización de inventarios en toda la red de cadena de suministro de HP. Este puesto actúa como puente entre la modelización de ciencia de datos y las operaciones analíticas, asegurando que el trabajo analítico avance sin problemas desde la exploración hasta la implementación y respalde una mejor planificación y toma de decisiones. El puesto trabaja estrechamente con otros científicos de datos, ingenieros de datos y equipos de planificación para diseñar, probar y escalar soluciones basadas en modelos en Databricks y GitHub. **Principales responsabilidades** * Construir y mantener flujos de trabajo analíticos reproducibles en Databricks utilizando Python, PySpark y MLflow. * Aplicar las mejores prácticas de ingeniería de características, incluidas las características retardadas (lag), los promedios móviles y el manejo adecuado de los cortes de datos. * Traducir prototipos en código parametrizado y reutilizable que soporte ejecuciones semanales o mensuales en producción. * Desarrollar y evaluar modelos para la previsión a corto plazo, el seguimiento de tasas de asociación (attach rate) y el análisis de buffers de inventario. * Vincular las salidas de los modelos con métricas comerciales tales como precisión de la previsión, sesgo y nivel de servicio. * Trabajar con planificadores y equipos comerciales para convertir excepciones, pedidos pendientes o problemas de servicio en características de datos o lógica analítica. * Garantizar el control de versiones y la reproducibilidad mediante GitHub y archivos de configuración. * Apoyar la integración de los resultados de los modelos con paneles de control (dashboards) y herramientas de apoyo a la toma de decisiones. * Colaborar con ingeniería de datos para validar las canalizaciones de datos y mantener la calidad de los datos. * Colaborar con científicos de datos especializados para convertir lógicas manuales recurrentes en procesos automatizados. * Participar en revisiones de código y documentación para garantizar la coherencia y el intercambio de conocimientos. * Identificar procesos redundantes o manuales y refactorizarlos en funciones compartidas o bibliotecas. * Contribuir a las mejores prácticas internas sobre reproducibilidad de modelos, documentación y transparencia analítica. **Habilidades y experiencia requeridas** Capacidad sólida en programación con Python, SQL, Databricks, GitHub y MLflow. Experiencia con Pandas, PySpark y Scikit-learn. Capacidad demostrada para construir modelos de regresión, clasificación o series temporales aplicados a contextos comerciales. Conocimiento de técnicas de ingeniería de características, como retardos (lag), promedios móviles y codificación categórica, así como conciencia de métodos para evitar filtraciones de datos (data leakage). Experiencia en automatización de flujos de trabajo, reproducibilidad y scripts parametrizados. Capacidad para explicar los resultados analíticos y el comportamiento de los modelos en términos comerciales. **Deseable** Conocimiento de datos de cadena de suministro o planificación, como previsiones, pedidos pendientes e inventarios. Experiencia con Power BI u otras herramientas de visualización similares. **Quién eres** Eres una persona resolutiva a la que le gusta transformar ideas analíticas en soluciones prácticas. Te sientes cómodo trabajando tanto en contextos de datos como comerciales, y puedes vincular conceptos estadísticos con resultados operativos. Eres metódico, organizado y te entusiasma ayudar a otros a desarrollar capacidades analíticas y de programación.


