Resumen:
CONDITION FOR PUBLICATION OF PROJECT. project addresses the early detection of anomalies in chest computed tomography
within the framework of preventive healthcare at the university level, aiming to support clinical
diagnosis through supervised artificial intelligence. The hypothesis states that a deep learning
model, trained with preprocessed and balanced data, can identify pulmonary abnormalities,
contributing to institutional epidemiological surveillance and aligning with SDG 3: Good Health
and Well-being.
For its development, images were collected and filtered from public databases such as NIH
ChestX-ray8, incorporating additional tuberculosis and pneumonia datasets. Preprocessing
techniques such as thoracic segmentation, CLAHE, and normalization were applied. Ten models
between machine learning and deep learning were trained and their performance was compared
using AUC-ROC, accuracy, and confusion matrices.
The results showed that DenseNet121, trained with a combined dataset of original and
segmented images, achieved the best performance (accuracy: 0.94, AUC: 0.91). Moreover,
segmentation improved predictions in most classes, although it introduced limitations in specific
cases such as emphysema.
It is concluded that supervised AI enhances automated diagnosis, and that preprocessing
quality and class balance are key factors in optimizing outcomes.
Keywords: artificial intelligence, chest tomography, anomaly detection, supervised learning
Descripción:
CONDICIONAMIENTO DE PUBLICACION DE PROYECTO. El proyecto aborda la detección temprana de anomalías en tomografías torácicas en el
contexto de salud preventiva universitaria, con el objetivo de apoyar el diagnóstico clínico
mediante inteligencia artificial supervisada. La hipótesis plantea que un modelo de aprendizaje
profundo, entrenado con datos preprocesados y balanceados, puede identificar alteraciones
torácicas, contribuyendo a la vigilancia epidemiológica institucional y alineándose con el ODS 3:
Salud y Bienestar.
Para su desarrollo, se recopilaron y depuraron imágenes de bases públicas como NIH
ChestX-ray8, incorporando además tuberculosis y neumonía de datasets complementarios. Se
aplicaron técnicas de preprocesamiento como segmentación torácica, CLAHE y normalización.
Se entrenaron cinco modelos de ML y cinco de DL, comparando su desempeño con métricas AUCROC,
accuracy y matrices de confusión.
Los resultados mostraron que DenseNet121, entrenado con un dataset combinado de
imágenes originales y segmentadas, alcanzó el mejor rendimiento (accuracy: 0.94, AUC: 0.91).
Además, la segmentación mejoró la precisión de predicción en la mayoría de las clases, aunque
generó limitaciones en casos específicos como enfisema.
Se concluye que el uso de IA supervisada fortalece el diagnóstico automatizado y que la
calidad del preprocesamiento y balance de clases es determinante para optimizar resultados.