Desarrollo de un sistema de auto-configuración de cómputo en la nube para reducción de costos

Farías Mera, Stefany Natalia; Moncayo Paz, Jorge Luis; Abad Robalino, Cristina Lucía

Por favor, use este identificador para citar o enlazar este ítem: http://www.dspace.espol.edu.ec/handle/123456789/66030

Título :	Desarrollo de un sistema de auto-configuración de cómputo en la nube para reducción de costos
Autor :	Farías Mera, Stefany Natalia Moncayo Paz, Jorge Luis Abad Robalino, Cristina Lucía
Palabras clave :	autoescalado aprendizaje por refuerzo computación en la nube AWS.
Fecha de publicación :	20-may-2025
Editorial :	ESPOL.FIEC
Citación :	Farías Mera S.N y Moncayo Paz J. L. (2024) Desarrollo de un sistema de auto-configuración de cómputo en la nube para reducción de costos [Proyecto Integrador] Escuela Superior Politécnica del Litoral
Resumen :	This paper addresses the implementation of an intelligent autoscaling system for cloud applications using reinforcement learning (RL). The primary objective is to design and evaluate a model that optimizes resource allocation in AWS through hybrid training, combining simulated and real-world metrics. The hypothesis is that this approach will improve efficiency and reduce operational costs compared to traditional dynamic scaling strategies. A deployment flow was implemented in AWS, starting in Lambda and scaling to Fargate and EC2 based on the workload. Services such as Amazon CloudWatch for monitoring, AWS ECR for container management, API Gateway, and an Application Load Balancer were used to create a global endpoint that unifies the URLs of each service. An RL agent was implemented that, based on traffic data and resource consumption, learned optimal scaling policies. The results showed that the RL model was able to reduce response times and improve resource utilization by 30% compared to static scaling strategies. Keywords: autoscaling, reinforcement learning, cloud computing, AWS.
Descripción :	El presente trabajo aborda la implementación de un sistema de autoescalado inteligente para aplicaciones en la nube utilizando aprendizaje por refuerzo (RL). El objetivo principal es diseñar y evaluar un modelo que optimice la asignación de recursos en AWS mediante un entrenamiento híbrido, combinando métricas simuladas y reales. Se plantea la hipótesis de que este enfoque mejorará la eficiencia y reducirá los costos operativos en comparación con estrategias tradicionales de escalamiento dinámico. Se implementó un flujo de despliegue en AWS, iniciando en Lambda y escalando hacia Fargate y EC2 en función de la carga de trabajo. Se utilizaron servicios como Amazon CloudWatch para la monitorización, AWS ECR para la gestión de contenedores, API Gateway y Application Load Balancer para la creación de un endpoint global que unifique las urls de cada servicio. Se implementó un agente de RL que, basado en datos de tráfico y consumo de recursos, aprendió políticas de escalamiento óptimas. Los resultados mostraron que el script definido con reglas heurísticas logró reducir los tiempos de respuesta y mejorar la utilización de recursos en un 30 % en comparación con estrategias de escalamiento estático
URI :	http://www.dspace.espol.edu.ec/handle/123456789/66030
metadata.dc.identifier.codigoproyectointegrador:	TECH-400
Aparece en las colecciones:	Tesis de Computación

Ficheros en este ítem:

Fichero	Tamaño	Formato
T-115304 TECH-400 FARIAS -MONCAYO.pdf	4.49 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem