DSpace Collection: Maestría en Ciencia de Datos

DSpace Collection: Maestría en Ciencia de Datos Maestría en Ciencia de Datos http://www.dspace.espol.edu.ec/handle/123456789/50567 2026-06-25T15:05:44Z 2026-06-25T15:05:44Z Desarrollo de un agente inteligente basado en aprendizaje automático para la mejora en la toma de decisiones estratégicas en la Dirección de Sostenibilidad de ESPOL Coello Suárez, Sandra Isabella Cruz Ochoa, Alberto Jose Córdova García, José Eduardo, Director http://www.dspace.espol.edu.ec/handle/123456789/68293 2026-05-13T16:06:33Z 2026-01-01T00:00:00Z

Title: Desarrollo de un agente inteligente basado en aprendizaje automático para la mejora en la toma de decisiones estratégicas en la Dirección de Sostenibilidad de ESPOL Authors: Coello Suárez, Sandra Isabella; Cruz Ochoa, Alberto Jose; Córdova García, José Eduardo, Director Abstract: The development of an intelligent agent based on machine learning to improve strategic decision-making within the Sustainability Directorate of the Escuela Superior Politécnica del Litoral addresses the critical limitation that real-time energy consumption analysis essential for meeting the Sustainable Development Goals (SDGs) and the ISO 50001 standard still requires manual handling and relies on intuitive criteria. This project highlights the need for an automated solution capable of transforming the technical data from the Personalized Recommendations for Efficient Consumption (PREC) platform into clear and actionable strategic recommendations, thereby minimizing operational workload. To this end, a conversational intelligent decision-support agent was designed and implemented, based on the ReAct architecture and the Retrieval-Augmented Generation (RAG) technique. The methodology included characterizing energy consumption patterns using Machine Learning models applied to time series data. The agent leveraged its reasoning capabilities to plan and execute code queries on the energy database, ensuring that outputs were grounded in factual data. As the main result, a functional prototype consisting of a conversational interface was developed. In conclusion, the intelligent agent significantly enhances the efficiency and traceability of the decision-making process in energy management. The system supports ESPOL’s transition toward more proactive and data-driven energy governance. Keywords: Intelligent Agent, Energy Management, ISO 50001, RAG, ReAct. Description: El Desarrollo de un agente inteligente basado en aprendizaje automático para la mejora en la toma de decisiones estratégicas en la Dirección de Sostenibilidad de la Escuela Superior Politécnica del Litoral aborda la limitación crítica de que el análisis de consumo energético en tiempo real, vital para el cumplimiento de los Objetivos de Desarrollo Sostenible (ODS) y la norma ISO 50001, aún requiere manipulación manual y se basa en criterios intuitivos. Este proyecto presenta la necesidad de una solución automatizada que transforme los datos técnicos de la plataforma Personalized Recommendations for Efficient Consumption (PREC) en recomendaciones estratégicas claras y accionables, minimizando la carga operativa. Para ello, se diseñó e implementó un agente inteligente conversacional de soporte a la decisión, basado en la arquitectura ReAct y la técnica de Generación Aumentada por Recuperación (RAG). La metodología incluyó la caracterización de patrones de consumo energético mediante modelos de Aprendizaje Automático sobre series de tiempo. El agente utilizó su capacidad de razonamiento para planificar y ejecutar consultas de código sobre la base de datos energética, asegurando que las salidas se fundamentan en datos fácticos. Como principal resultado, se logró un prototipo funcional que consta de una interfaz conversacional. En conclusión, el agente inteligente mejora significativamente la eficiencia y la trazabilidad del proceso de toma de decisiones en la gestión energética. El sistema apoya la transición de ESPOL hacia una gobernanza energética más proactiva y basada en datos.

2026-01-01T00:00:00Z Optimización de la gestión del inventario de producto terminado en una fábrica productora de aderezos y salsas, mediante modelos de aprendizaje automático Ortiz Lascano, Mauricio Ricardo Armas Andrade, Gandhi Francisco Calva Yaguana, Karen Priscila, Director http://www.dspace.espol.edu.ec/handle/123456789/68292 2026-05-13T15:55:47Z 2025-01-01T00:00:00Z

Title: Optimización de la gestión del inventario de producto terminado en una fábrica productora de aderezos y salsas, mediante modelos de aprendizaje automático Authors: Ortiz Lascano, Mauricio Ricardo; Armas Andrade, Gandhi Francisco; Calva Yaguana, Karen Priscila, Director Abstract: This project addresses the problem of inventory planning in a food manufacturing company through short-term demand forecasting. The objective was to develop a system capable of estimating product sales for the next fifteen days to optimize inventory levels and improve operational efficiency. The proposal is justified by the need to reduce storage costs, prevent stockouts, and strengthen data-driven decision-making. Historical sales data from 2024 were used, including information on quantities sold, prices, dates, and product characteristics. The data underwent cleaning, integration, and feature-enrichment processes, after which three predictive models were trained: Exponential Moving Average, Multilayer Perceptron, and Random Forest. The experiments followed a supervised learning methodology and used error metrics such as MAE and RMSE. The results showed that the Random Forest model achieved the best performance across all product segments. Therefore, it constitutes the proposed solution for the forecasting system. It is concluded that this approach improves inventory planning and provides a reliable tool for decision support. Keywords: Demand forecasting, Random Forest, inventory, data analysis, predictive models. Description: El presente proyecto aborda el problema de la planificación de inventario en una fábrica de alimentos mediante la predicción de la demanda a corto plazo. El objetivo fue desarrollar un sistema capaz de estimar las ventas de los siguientes quince días para cada producto, con el fin de optimizar los niveles de inventario y mejorar la eficiencia operativa. La propuesta se justifica por la necesidad de reducir costos de almacenamiento, evitar quiebres de stock y fortalecer la toma de decisiones basada en datos. Para el desarrollo del modelo se utilizaron datos históricos de ventas del año 2024, que incluyeron información de volúmenes vendidos, precios, fechas y características de los productos. Se aplicaron procesos de limpieza, integración y enriquecimiento de datos, y posteriormente se entrenaron tres modelos de predicción: Exponential Moving Average, Multilayer Perceptron y Random Forest. Los experimentos se ejecutaron siguiendo una metodología supervisada y utilizando métricas de error como MAE y RMSE. Los resultados mostraron que el modelo Random Forest obtuvo el mejor desempeño en todos los segmentos de productos. Por lo tanto, constituye la solución propuesta para el sistema de pronóstico. Se concluye que esta aproximación permite mejorar la planificación de inventario y constituye una herramienta sólida para el soporte de decisiones.

2025-01-01T00:00:00Z Análisis predictivo del potencial comercial de industrias en el Ecuador para una empresa gestora ambiental Garzón Arreaga, Paulina Michell Garófalo Cervantes, Marco Andrés Galarza Morales, Christian Eduardo, Director http://www.dspace.espol.edu.ec/handle/123456789/68288 2026-05-13T15:45:00Z 2026-01-01T00:00:00Z

Title: Análisis predictivo del potencial comercial de industrias en el Ecuador para una empresa gestora ambiental Authors: Garzón Arreaga, Paulina Michell; Garófalo Cervantes, Marco Andrés; Galarza Morales, Christian Eduardo, Director Abstract: The present research is developed in the context of industrial waste management and the transition toward circular economy models in Ecuador, where environmental management companies face the challenge of identifying and prioritizing industrial clients with high commercial potential. Therefore, the objective of this study is to develop a commercial intelligence system based on predictive analytics that estimates the probability of industrial companies converting into effective clients. This approach is justified by the need to reduce reliance on empirical criteria and to optimize commercial decision-making using structured data. During the development of the project, a quantitative approach was applied, integrating information from internal sources of an environmental management company with public databases obtained from official institutions. Data cleaning, normalization, and integration processes were performed, incorporating firmographic, financial, contextual, and environmental variables. Subsequently, supervised machine learning models were trained and validated to evaluate their predictive performance. The results showed that the developed model made it possible to assign a conversion score to each company, improving prospect prioritization and reducing the operational workload associated with manual prospecting. Additionally, greater alignment between marketing and sales criteria was observed. In conclusion, the proposed system contributes to strengthening operational efficiency, commercial intelligence, and data-driven decision-making in the Ecuadorian industrial sector. Keywords: Industrial waste management, Commercial intelligence, Predictive analytics, Machine learning, Client prospecting. Description: La siguiente investigación se desarrolla en el contexto de la gestión de residuos industriales y la transición hacia modelos de economía circular en el Ecuador, donde las empresas gestoras ambientales enfrentan el desafío de identificar y priorizar clientes industriales con alto potencial comercial. Por lo tanto el objetivo del estudio se centra en desarrollar un sistema de inteligencia comercial basado en análisis predictivo que permita estimar la probabilidad de conversión de empresas industriales en clientes efectivos, justificándose en la necesidad de reducir la dependencia de criterios empíricos y optimizar la toma de decisiones comerciales mediante el uso de datos. Durante el desarrollo del proyecto se utilizó un enfoque cuantitativo, que integró la información proveniente de fuentes internas de una empresa gestora ambiental con bases de datos públicas provenientes de instituciones oficiales. Para la unión de esta información se utilizaron procesos de limpieza, normalización e integración de datos, incorporando variables firmográficas, financieras, contextuales y ambientales. Posteriormente, se entrenaron y validaron modelos de aprendizaje automático con el fin de evaluar su desempeño predictivo. Los resultados obtenidos evidenciaron que el modelo desarrollado permitió asignar un puntaje por empresa, mejorando la priorización de prospectos y reduciendo la carga operativa asociada a la prospección manual. Asimismo, se observó una mayor alineación entre los criterios de marketing y ventas. En conclusión, el sistema propuesto contribuye a fortalecer la eficiencia operativa, la inteligencia comercial y la toma de decisiones basada en datos en el sector industrial ecuatoriano.

2026-01-01T00:00:00Z Estimación de tiempos de carga de transportes mediante modelos Machine Learning para una planta de distribución de productos de nutrición de cultivo Reyes Clemente, Galo Alexander Sisalima Jiménez, Kevin Franklin Torres Moran, Danny Alfredo, Director http://www.dspace.espol.edu.ec/handle/123456789/68286 2026-05-13T14:57:56Z 2025-01-01T00:00:00Z

Title: Estimación de tiempos de carga de transportes mediante modelos Machine Learning para una planta de distribución de productos de nutrición de cultivo Authors: Reyes Clemente, Galo Alexander; Sisalima Jiménez, Kevin Franklin; Torres Moran, Danny Alfredo, Director Abstract: This project aims to implement an interactive visualization tool based on machine learning models to support logistical planning and improve loading efficiency in a crop nutrition production plant. The CRISP–DM methodology was applied to structure the process, including business understanding, exploratory analysis, data preparation, predictive modeling, and deployment within Power BI. Supervised regression models (Linear Regression, Random Forest, and XGBoost) were trained, with Random Forest achieving the best performance. The model reduced the average planning error from 14.02 to 7.38 minutes, representing a 47.3% improvement compared to the current manual estimation method used by the plant. The visualization tool enables planners to view predicted loading times, compare them with actual values, and identify operational deviations through indicators such as OTIF. The economic assessment shows operational savings of approximately USD 1,200 to USD 1,600 per month, equivalent to around USD 18,000 annually, excluding indirect benefits such as reduced idle time and improved process stability. The study demonstrates the feasibility of integrating machine learning techniques with business intelligence tools in real logistics environments, providing a methodological framework that can be replicated in similar industrial operations. Keywords: logistics, machine learning, Random Forest, CRISP–DM, data visualization, Power BI, loading time estimation. Description: El presente proyecto tiene como objetivo implementar una herramienta de visualización interactiva basada en modelos de aprendizaje automático para apoyar la planificación logística y mejorar la eficiencia del proceso de carga en una planta de productos de nutrición de cultivos. Se aplicó la metodología CRISP–DM para estructurar el análisis, incluyendo la comprensión del negocio, el análisis exploratorio, la preparación de datos, el modelado predictivo y el despliegue en Power BI. Se entrenaron modelos de regresión supervisada (Regresión Lineal, Random Forest y XGBoost), determinándose que Random Forest ofrece el mejor desempeño al reducir el error promedio de planificación de 14.02 a 7.38 minutos, lo que representa una mejora del 47.3 % respecto al método manual utilizado por la planta. La herramienta desarrollada permite visualizar estimaciones de tiempo de carga por jornada, comparar valores reales y predichos, e identificar desviaciones operativas mediante indicadores como OTIF. El análisis económico evidencia un ahorro operativo estimado entre USD 1,200 y USD 1,600 mensuales, equivalente a aproximadamente USD 18,000 anuales, sin considerar beneficios indirectos como la reducción de tiempos muertos y la mayor estabilidad del proceso. El estudio demuestra la viabilidad de integrar técnicas de machine learning y herramientas de inteligencia de negocios en entornos logísticos reales, aportando una base metodológica aplicable a otras operaciones del sector

2025-01-01T00:00:00Z