Resumen:
This thesis introduces AINet, a novel deep learning architecture designed for detecting camouflaged
objects in complex and diverse environments. AINet leverages the strengths of Mamba, an efficient
sequential state model for capturing long-range dependencies, and the Convolutional Block Attention
Module (CBAM) for feature refinement through attention mechanisms. Detecting camouflaged objects
is a significant challenge across a wide range of real-world applications, including surveillance, security,
medical imaging, and autonomous systems, where objects of interest may blend into their backgrounds
and evade conventional detection methods. To demonstrate its effectiveness, AINet is evaluated
on multiple datasets, including standard camouflaged object detection benchmarks such as CAMO,
COD10K, and NC4K, as well as pest detection datasets. Experimental results show that AINet outperforms
existing state-of-the-art models. The code is publicly available on GitHub for reproducibility:
https://github.com/hvelesaca/AINet.
Descripción:
Esta tesis presenta AINet, una novedosa arquitectura de aprendizaje profundo diseñada para detectar
objetos camuflados en entornos complejos y diversos. AINet aprovecha las ventajas de Mamba,
un eficiente modelo de estados secuenciales para capturar dependencias de largo alcance, y Convolutional
Block Attention Module (CBAM) para el refinamiento de características mediante mecanismos
de atención. Detectar objetos camuflados supone un reto significativo en una amplia gama de
aplicaciones del mundo real, como vigilancia, seguridad, imágenes médicas y sistemas autónomos,
donde los objetos de interés pueden mimetizarse con el entorno y evadir los métodos de detección
convencionales. Para demostrar su eficacia, AINet se evalúa en múltiples datasets, incluyendo benchmarks
de detección de objetos camuflados como CAMO, COD10K y NC4K, así como un dataset para
detección de plagas. Los resultados experimentales muestran que AINet supera a modelos recientes
del estado del arte. El código está disponible públicamente en GitHub para su reproducibilidad:
https://github.com/hvelesaca/AINet