Resumen:
CONDITION FOR PUBLICATION OF PROJECT. In Ecuador, the lack of labeled agricultural data is a major obstacle to long-term planning, land management, and the development
of evidence-based public policies. This data scarcity hinders the generation of reliable land use maps, especially
when aiming to understand the spatial distribution and temporal dynamics of key crops. This thesis tackles this challenge
by evaluating different crop classification strategies using satellite imagery, with a focus on low-data scenarios. Three main
approaches are compared: traditional models (e.g., Random Forest), Convolutional Neural Networks (CNNs), and Presto, a
recent model in the literature. Various combinations of spectral inputs (RGB, 10 bands, and indices) and classification types
(binary and multiclass) are tested and evaluated using metrics such as the macro F1-score. The results show that traditional
models remain robust in low-resource settings, while CNNs offer modest improvements. Presto demonstrates a promising
trade-off between accuracy and computational efficiency, enabling the generation of informative maps for agricultural monitoring.
This work highlights that even in data-constrained environments, it is possible to adapt machine learning methods
to improve crop mapping and support decision-making in the agricultural sector.
Descripción:
CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. En Ecuador, la escasez de datos etiquetados sobre cultivos agrícolas representa una barrera significativa para la planificación
territorial, la gestión de recursos y el desarrollo de políticas públicas a largo plazo. Esta falta de información dificulta la
generación de mapas confiables de uso del suelo, especialmente en un contexto donde se requiere conocer la distribución y
evolución de los principales cultivos del país. Esta tesis aborda dicho problema mediante la evaluación de distintas estrategias
de clasificación de cultivos a partir de imágenes satelitales, considerando escenarios con datos limitados. Se comparan
tres enfoques: modelos tradicionales (como Random Forest), redes neuronales convolucionales (CNN) y el modelo Transformador
de teledetección preentrenado (Presto por sus siglas en inglés), recientemente propuesto en la literatura. Se utilizan
diferentes combinaciones de entradas espectrales (RGB, 10 bandas e índices) y tipos de clasificación (binaria y multiclase),
evaluando su desempeño mediante métricas como el F1-score macro. Los resultados muestran que, en contextos de escasez
de datos, los modelos tradicionales siguen siendo una alternativa sólida, mientras que las CNN aportan mejoras moderadas.
El modelo Presto ofrece un balance prometedor entre precisión y eficiencia computacional, generando mapas útiles para
el monitoreo agrícola. Este trabajo demuestra que, incluso en países con recursos limitados, es posible adaptar estrategias
de aprendizaje automático para mejorar la representación espacial de cultivos y apoyar la toma de decisiones en el sector
agrícola.