<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <title>DSpace Collection: Maestría en Ciencia de Datos</title>
  <link rel="alternate" href="http://www.dspace.espol.edu.ec/handle/123456789/50567" />
  <subtitle>Maestría en Ciencia de Datos</subtitle>
  <id>http://www.dspace.espol.edu.ec/handle/123456789/50567</id>
  <updated>2026-02-21T05:24:44Z</updated>
  <dc:date>2026-02-21T05:24:44Z</dc:date>
  <entry>
    <title>Desarrollo de un sistema de recomendación de compra utilizando algoritmos de aprendizaje automático de sugerencia para la promoción efectiva de combos y ofertas</title>
    <link rel="alternate" href="http://www.dspace.espol.edu.ec/handle/123456789/67380" />
    <author>
      <name>Bravo Muentes, Kevin Hernán</name>
    </author>
    <author>
      <name>Viñan Camacho, Ana Belén</name>
    </author>
    <author>
      <name>Bauz Olvera, Sergio Alex, Director</name>
    </author>
    <id>http://www.dspace.espol.edu.ec/handle/123456789/67380</id>
    <updated>2026-01-21T16:04:21Z</updated>
    <published>2024-01-01T00:00:00Z</published>
    <summary type="text">Title: Desarrollo de un sistema de recomendación de compra utilizando algoritmos de aprendizaje automático de sugerencia para la promoción efectiva de combos y ofertas
Authors: Bravo Muentes, Kevin Hernán; Viñan Camacho, Ana Belén; Bauz Olvera, Sergio Alex, Director
Abstract: CONDITION FOR PUBLICATION OF PROJECT. In the retail sector, improving product offerings is essential for increasing sales and enhancing the customer experience. This study develops a product recommendation system aimed at commercial and sales teams, with the goal of suggesting product combinations that improve profitability. Three machine learning algorithms were implemented: K-Nearest Neighbors (KNN), Alternating Least Squares (ALS), and Neural Collaborative Filtering (NCF), evaluating their performance using Precision, Recall, and F1-Score.&#xD;
Historical purchase data was analyzed to identify consumption patterns and segment products. The models were then trained and evaluated in different scenarios to determine the best-performing model for generating recommendations. The results show that NCF achieved the best performance, providing more accurate suggestions.&#xD;
Additionally, an interactive application prototype was developed, allowing commercial teams to select products and receive real-time recommendations. This approach facilitates promotion planning and improves data-driven decision-making.&#xD;
It is concluded that the developed recommendation system serves as a valuable tool for product management in retail, enhancing the customer experience and the efficiency of commercial strategies.&#xD;
Keywords: Recommendation systems, Retail, Machine learning, Data science.
Description: CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. En el sector retail, mejorar la oferta de productos es fundamental para aumentar las ventas y mejorar la experiencia del cliente. Este estudio desarrolla un sistema de recomendación de productos para equipos comerciales y de ventas, con el objetivo de sugerir combinaciones de productos que mejoren la rentabilidad. Se implementaron tres algoritmos de aprendizaje automático: K-Nearest Neighbors (KNN), Alternating Least Squares (ALS) y Neural Collaborative Filtering (NCF), evaluando su desempeño con Precisión, Recall y F1-Score.&#xD;
Se analizaron datos históricos de compras para identificar patrones de consumo y segmentar productos. Luego, los modelos fueron entrenados y evaluados para determinar el de mejor desempeño en la generación de recomendaciones. Los resultados indicaron que el modelo NCF obtuvo la mejor precisión, proporcionando sugerencias más acertadas.&#xD;
Además, se diseñó un prototipo de aplicación interactiva que permite a los equipos comerciales seleccionar productos y recibir recomendaciones en tiempo real. Este enfoque facilita la planificación de promociones y mejora la toma de decisiones basada en datos.&#xD;
Se concluye que el sistema desarrollado representa una herramienta útil para la gestión de productos en retail, mejorando la experiencia del cliente y la eficiencia de las estrategias comerciales.</summary>
    <dc:date>2024-01-01T00:00:00Z</dc:date>
  </entry>
  <entry>
    <title>Estimación de gastos médicos para clientes corporativos en beneficio a una agencia de seguros mediante el uso de modelos de aprendizaje automático</title>
    <link rel="alternate" href="http://www.dspace.espol.edu.ec/handle/123456789/67377" />
    <author>
      <name>Morales Mendoza, José Francisco</name>
    </author>
    <author>
      <name>Guevara Esteves, Melanie Rommina</name>
    </author>
    <author>
      <name>Bauz Olvera, Sergio Alex, Director</name>
    </author>
    <id>http://www.dspace.espol.edu.ec/handle/123456789/67377</id>
    <updated>2026-01-21T15:48:36Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Estimación de gastos médicos para clientes corporativos en beneficio a una agencia de seguros mediante el uso de modelos de aprendizaje automático
Authors: Morales Mendoza, José Francisco; Guevara Esteves, Melanie Rommina; Bauz Olvera, Sergio Alex, Director
Abstract: CONDITION FOR PUBLICATION OF PROJECT. project developed a predictive model to estimate medical expenses covered by&#xD;
insurance companies, using historical data from employees of corporate clients. Through&#xD;
preprocessing techniques, dimensionality reduction (UMAP), clustering (KMeans), and&#xD;
advanced regression models such as Random Forest, Gradient Boosting, and XGBoost, a&#xD;
scalable and accurate tool was built. The model enables more precise forecasting of future&#xD;
medical expenses, improving financial planning for both insurers and policyholders by&#xD;
reducing information asymmetry in risk management. Additionally, an interactive visualization&#xD;
tool was developed to help end users interpret the results with ease. The methodology is&#xD;
proven to be replicable and shows clear opportunities for improvement, including the&#xD;
incorporation of new explanatory variables and the use of more sophisticated algorithms.&#xD;
Future versions of the model should integrate larger datasets to enhance the prediction of&#xD;
specific health conditions.
Description: CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. Este proyecto desarrolló un modelo predictivo para estimar el gasto médico cubierto&#xD;
por aseguradoras, utilizando datos históricos de empleados pertenecientes a clientes&#xD;
corporativos. Mediante técnicas de preprocesamiento, reducción de dimensionalidad&#xD;
(UMAP), segmentación (KMeans) y modelos de regresión avanzados como Random Forest,&#xD;
Gradient Boosting y XGBoost, se construyó una herramienta precisa y escalable. El modelo&#xD;
permite anticipar con mayor precisión los gastos futuros y facilitar la planificación financiera,&#xD;
tanto para la aseguradora como para el asegurado, reduciendo la asimetría de la información&#xD;
en la gestión del riesgo. Además, se diseñó una herramienta de visualización interactiva que&#xD;
facilita la interpretación de los resultados por parte de los usuarios finales. Se concluye que&#xD;
la metodología es replicable y que existen claras oportunidades de mejora, como la&#xD;
incorporación de nuevas variables explicativas y el uso de algoritmos más sofisticados.&#xD;
Futuras versiones del modelo deberán integrar una mayor cantidad de datos para optimizar&#xD;
la predicción de ciertos tipos de afectaciones a la salud.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
  <entry>
    <title>Desarrollo de un sistema predictivo para la asignación óptima de cupos de crédito en una empresa de nutrición animal</title>
    <link rel="alternate" href="http://www.dspace.espol.edu.ec/handle/123456789/67375" />
    <author>
      <name>Sánchez Astudillo, Andy Evirley</name>
    </author>
    <author>
      <name>Galarza Morales, Christian Eduardo, Director</name>
    </author>
    <id>http://www.dspace.espol.edu.ec/handle/123456789/67375</id>
    <updated>2026-01-21T15:28:12Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Desarrollo de un sistema predictivo para la asignación óptima de cupos de crédito en una empresa de nutrición animal
Authors: Sánchez Astudillo, Andy Evirley; Galarza Morales, Christian Eduardo, Director
Abstract: CONDITION FOR PUBLICATION OF PROJECT. This project focuses on the development of a predictive model that, at invoice issuing, estimates the risk of non‑payment in a company’s accounts receivable. The hypothesis posits that by applying machine learning techniques it is possible to identify customers at elevated risk of default before it occurs, shifting collections management from a reactive to a proactive approach. The motivation stems from the need to reduce the costs and effort involved in recovering overdue accounts, while optimizing cash flow and improving the organization’s financial health.&#xD;
Simulated historical data inspired by the animal nutrition sector was used, with structures and variables like those typically managed by companies in the industry. Data preprocessing included record cleaning, generation of additional features, removal of redundant variables through correlation analysis, and class balancing via SMOTE, ensuring a robust and representative dataset for model training.&#xD;
Logistic regression, decision trees, random forest, and LightGBM algorithms were trained using time‑based validation and grid search for hyperparameter tuning. Performance was evaluated with metrics such as precision, recall, and F1‑score, with particular emphasis on the ability to detect true defaults. The random forest model demonstrated a superior balance between accuracy and generalization, emerging as the most robust choice for production deployment.&#xD;
Finally, an interactive Gradio prototype was developed that, upon selecting a customer and optionally adjusting their payment parameters, calculates in real time the probability of default for a new invoice. This tool is proposed as a strategic asset for proactive receivables management, reducing delinquency risk and strengthening the company’s financial sustainability.&#xD;
Keywords: predictive model, default risk, machine learning, receivables management, financial risk.
Description: CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. Este proyecto se centra en el desarrollo de un modelo predictivo que, al emitir una factura, estime el riesgo de impago en las cuentas por cobrar de un negocio. La hipótesis plantea que mediante técnicas de machine learning es posible identificar a clientes con alto riesgo de impago antes de que ocurra, pretendiendo cambiar la gestión de cobranza de reactiva a preventiva. La motivación surge de la necesidad de disminuir los costos y el esfuerzo involucrados en la recuperación de cuentas vencidas, al tiempo que se optimiza el flujo de caja y se mejora la salud financiera.&#xD;
Se utilizaron datos históricos simulados, inspirados en el sector de nutrición animal, con estructuras y variables similares a las que se gestionan habitualmente en negocios del rubro. El preprocesamiento de los datos incluyó la limpieza de registros, generación de variables adicionales, eliminación de características redundantes tras un análisis de correlación y balanceo de clases mediante SMOTE, asegurando un conjunto de datos robusto y representativo para el entrenamiento de los modelos.&#xD;
Se compararon cuatro algoritmos: regresión logística, árboles de decisión, random forest y LightGBM; mediante validación temporal y búsqueda en cuadrícula de hiperparámetros. Posteriormente se evaluó su desempeño con métricas como precisión, recall y F1-score, poniendo especial énfasis en la capacidad de detectar verdaderos impagos. El random forest demostró un equilibrio superior entre precisión y generalización, imponiéndose como la opción más robusta para su implementación en producción.&#xD;
Finalmente, se lanzó un prototipo interactivo con Gradio que, al seleccionar un cliente y ajustarse opcionalmente sus parámetros de pago, calcula en tiempo real la probabilidad de impago de una nueva factura. Esta herramienta se propone como un activo estratégico para una gestión de cartera proactiva, reduciendo el riesgo de morosidad y fortaleciendo la sostenibilidad financiera del negocio.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
  <entry>
    <title>Sistema de recomendación para el abastecimiento de remolcadores en embarcaciones de hidrocarburos utilizando técnicas de machine learning</title>
    <link rel="alternate" href="http://www.dspace.espol.edu.ec/handle/123456789/67373" />
    <author>
      <name>Galarza Ayala, Paola Elizabeth</name>
    </author>
    <author>
      <name>Wong Blacio, Andrés Gilberto, Director</name>
    </author>
    <id>http://www.dspace.espol.edu.ec/handle/123456789/67373</id>
    <updated>2026-01-21T15:17:15Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Sistema de recomendación para el abastecimiento de remolcadores en embarcaciones de hidrocarburos utilizando técnicas de machine learning
Authors: Galarza Ayala, Paola Elizabeth; Wong Blacio, Andrés Gilberto, Director
Abstract: CONDITION FOR PUBLICATION OF PROJECT. The forecast for the supply of tugboats at a maritime oil terminal is addressed. The proposed objective was to perform a descriptive and predictive analysis of the demand for tugboats using machine learning techniques. The hypothesis is that ML models can be reliable, as can statistical-econometric and deep learning models; the justification lies in the absence of technological tools in port logistics. To develop this solution, the KDD (Knowledge Discovery in Databases) methodology was used for a heuristic and empirical approach. Operational and meteorological data were integrated and refined; the temporal structure (level, trend, seasonality, and noise) was explored, and statistical and visual tests were applied to the characteristics of the series. Gradient trees were modeled using the Skforecast library in a univariate and multistep approach, under computational constraints. To avoid data leakage, cross-validation was used in conjunction with the backtesting technique. Appropriate metrics were adapted to the series to evaluate performance under real conditions, reinforcing validity in operational contexts with high variability and uncertainty. The results obtained a model that achieved 81.11% coverage and an accuracy of RMdSE=0.051340. In conclusion, this proposal lays the foundation for more informed, efficient, and proactive decision-making in a sector.&#xD;
Keywords: Skforecast; time series forecasting; tugboats; oil ports; forecasting.
Description: CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. Se aborda el pronóstico para el abastecimiento de remolcadores en un terminal petrolero marítimo. El objetivo propuesto consistió en realizar un análisis descriptivo y predictivo de la demanda de remolcadores mediante técnicas de Machine Learning. Se plantea como hipótesis que los modelos ML pueden ser fiables, así como los modelos estadísticos-econométricos y Deep Learning; la justificación radica en la ausencia de herramientas tecnológicas en la logística portuaria. Para el desarrollo de esta solución se utilizó la metodología KDD (Knowledge Discovery in databases) para un enfoque heurístico e empírico. Se integraron y depuraron datos operativos y meteorológicos; se exploró la estructura temporal (nivel, tendencia, estacionalidad y ruido), y se aplicaron pruebas estadísticas y visuales sobre las características de la serie. Se modeló con árboles de gradiente usando la biblioteca Skforecast en un enfoque univariante y multistep, bajo restricción computacional. Para evitar data leakage se recurrió a la validación cruzada en conjunto con la técnica backtesting. Se adaptó métricas apropiadas a la serie para evaluar el desempeño bajo condiciones reales, reforzando la validez en contextos operativos con alta variabilidad e incertidumbre. En los resultados se obtuvo un modelo que alcanzó 81.11% de cobertura y con una precisión de RMdSE=0.051340. Como conclusión, esta propuesta sienta el inicio de las bases para una toma de decisiones más informada, eficiente y proactiva en un sector estratégico del país.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
</feed>

