Please use this identifier to cite or link to this item:
http://www.dspace.espol.edu.ec/handle/123456789/67375| Title: | Desarrollo de un sistema predictivo para la asignación óptima de cupos de crédito en una empresa de nutrición animal |
| Authors: | Sánchez Astudillo, Andy Evirley Galarza Morales, Christian Eduardo, Director |
| Keywords: | modelo predictivo morosidad Machine Learning gestión de cartera riesgo financiero |
| Issue Date: | 2025 |
| Publisher: | ESPOL.FIEC |
| Citation: | Sánchez Astudillo A.E. ( 2025). Desarrollo de un sistema predictivo para la asignación óptima de cupos de crédito en una empresa de nutrición animal [Proyecto de Titulación] Escuela Superior Politécnica del Litoral |
| Abstract: | CONDITION FOR PUBLICATION OF PROJECT. This project focuses on the development of a predictive model that, at invoice issuing, estimates the risk of non‑payment in a company’s accounts receivable. The hypothesis posits that by applying machine learning techniques it is possible to identify customers at elevated risk of default before it occurs, shifting collections management from a reactive to a proactive approach. The motivation stems from the need to reduce the costs and effort involved in recovering overdue accounts, while optimizing cash flow and improving the organization’s financial health. Simulated historical data inspired by the animal nutrition sector was used, with structures and variables like those typically managed by companies in the industry. Data preprocessing included record cleaning, generation of additional features, removal of redundant variables through correlation analysis, and class balancing via SMOTE, ensuring a robust and representative dataset for model training. Logistic regression, decision trees, random forest, and LightGBM algorithms were trained using time‑based validation and grid search for hyperparameter tuning. Performance was evaluated with metrics such as precision, recall, and F1‑score, with particular emphasis on the ability to detect true defaults. The random forest model demonstrated a superior balance between accuracy and generalization, emerging as the most robust choice for production deployment. Finally, an interactive Gradio prototype was developed that, upon selecting a customer and optionally adjusting their payment parameters, calculates in real time the probability of default for a new invoice. This tool is proposed as a strategic asset for proactive receivables management, reducing delinquency risk and strengthening the company’s financial sustainability. Keywords: predictive model, default risk, machine learning, receivables management, financial risk. |
| Description: | CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. Este proyecto se centra en el desarrollo de un modelo predictivo que, al emitir una factura, estime el riesgo de impago en las cuentas por cobrar de un negocio. La hipótesis plantea que mediante técnicas de machine learning es posible identificar a clientes con alto riesgo de impago antes de que ocurra, pretendiendo cambiar la gestión de cobranza de reactiva a preventiva. La motivación surge de la necesidad de disminuir los costos y el esfuerzo involucrados en la recuperación de cuentas vencidas, al tiempo que se optimiza el flujo de caja y se mejora la salud financiera. Se utilizaron datos históricos simulados, inspirados en el sector de nutrición animal, con estructuras y variables similares a las que se gestionan habitualmente en negocios del rubro. El preprocesamiento de los datos incluyó la limpieza de registros, generación de variables adicionales, eliminación de características redundantes tras un análisis de correlación y balanceo de clases mediante SMOTE, asegurando un conjunto de datos robusto y representativo para el entrenamiento de los modelos. Se compararon cuatro algoritmos: regresión logística, árboles de decisión, random forest y LightGBM; mediante validación temporal y búsqueda en cuadrícula de hiperparámetros. Posteriormente se evaluó su desempeño con métricas como precisión, recall y F1-score, poniendo especial énfasis en la capacidad de detectar verdaderos impagos. El random forest demostró un equilibrio superior entre precisión y generalización, imponiéndose como la opción más robusta para su implementación en producción. Finalmente, se lanzó un prototipo interactivo con Gradio que, al seleccionar un cliente y ajustarse opcionalmente sus parámetros de pago, calcula en tiempo real la probabilidad de impago de una nueva factura. Esta herramienta se propone como un activo estratégico para una gestión de cartera proactiva, reduciendo el riesgo de morosidad y fortaleciendo la sostenibilidad financiera del negocio. |
| URI: | http://www.dspace.espol.edu.ec/handle/123456789/67375 |
| metadata.dc.identifier.codigoproyectointegrador: | POSTG156 |
| Appears in Collections: | Tesis de Maestría en Ciencia de Datos |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| T-115503 POSTG156 SANCHEZ ANDY.pdf | 1.81 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.