Resumen:
CONDITION FOR PUBLICATION OF PROJECT. The forecast for the supply of tugboats at a maritime oil terminal is addressed. The proposed objective was to perform a descriptive and predictive analysis of the demand for tugboats using machine learning techniques. The hypothesis is that ML models can be reliable, as can statistical-econometric and deep learning models; the justification lies in the absence of technological tools in port logistics. To develop this solution, the KDD (Knowledge Discovery in Databases) methodology was used for a heuristic and empirical approach. Operational and meteorological data were integrated and refined; the temporal structure (level, trend, seasonality, and noise) was explored, and statistical and visual tests were applied to the characteristics of the series. Gradient trees were modeled using the Skforecast library in a univariate and multistep approach, under computational constraints. To avoid data leakage, cross-validation was used in conjunction with the backtesting technique. Appropriate metrics were adapted to the series to evaluate performance under real conditions, reinforcing validity in operational contexts with high variability and uncertainty. The results obtained a model that achieved 81.11% coverage and an accuracy of RMdSE=0.051340. In conclusion, this proposal lays the foundation for more informed, efficient, and proactive decision-making in a sector.
Keywords: Skforecast; time series forecasting; tugboats; oil ports; forecasting.
Descripción:
CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. Se aborda el pronóstico para el abastecimiento de remolcadores en un terminal petrolero marítimo. El objetivo propuesto consistió en realizar un análisis descriptivo y predictivo de la demanda de remolcadores mediante técnicas de Machine Learning. Se plantea como hipótesis que los modelos ML pueden ser fiables, así como los modelos estadísticos-econométricos y Deep Learning; la justificación radica en la ausencia de herramientas tecnológicas en la logística portuaria. Para el desarrollo de esta solución se utilizó la metodología KDD (Knowledge Discovery in databases) para un enfoque heurístico e empírico. Se integraron y depuraron datos operativos y meteorológicos; se exploró la estructura temporal (nivel, tendencia, estacionalidad y ruido), y se aplicaron pruebas estadísticas y visuales sobre las características de la serie. Se modeló con árboles de gradiente usando la biblioteca Skforecast en un enfoque univariante y multistep, bajo restricción computacional. Para evitar data leakage se recurrió a la validación cruzada en conjunto con la técnica backtesting. Se adaptó métricas apropiadas a la serie para evaluar el desempeño bajo condiciones reales, reforzando la validez en contextos operativos con alta variabilidad e incertidumbre. En los resultados se obtuvo un modelo que alcanzó 81.11% de cobertura y con una precisión de RMdSE=0.051340. Como conclusión, esta propuesta sienta el inicio de las bases para una toma de decisiones más informada, eficiente y proactiva en un sector estratégico del país.