Resumen:
This project aims to develop an automated method for classifying construction
elements in BIM models using natural language processing (NLP) and the ASTM
Uniformat II standard. The hypothesis suggests that advanced techniques such
as NLP and machine learning models significantly improve the accuracy and
efficiency of BIM element classification. The project’s importance lies in
optimizing construction processes through standardization and reducing data
management errors. For the development, the BERT model was fine-tuned to
classify elements under the ASTM Uniformat II standard, and Dynamo was used
for data extraction and organization. Techniques included the integration of deep
learning algorithms, semantic data processing, and result validation using
confusion matrices. Materials consisted of BIM models created in Revit, with
analyses performed using Python and specific NLP libraries. The results showed
that the BERT model achieved an accuracy of 48.77% at Level 1, but its
performance decreased at more detailed levels, reaching only 4.33% accuracy at
Level 4. These findings highlighted the model’s limitations in granular
classifications. It is concluded that automated models improve classification at
general levels but require adjustments to enhance precision in specific levels.
This reinforces the relevance of natural language processing in BIM information
management.
Keywords: BIM, Uniformat II, natural language processing, automated
classification.
Descripción:
El presente proyecto tiene como objetivo desarrollar un método automatizado
para clasificar elementos de construcción en modelos BIM, empleando
procesamiento de lenguaje natural (NLP) y el estándar ASTM Uniformat II. La
hipótesis plantea que el uso de técnicas avanzadas como NLP y modelos de
aprendizaje automático mejora significativamente la precisión y eficiencia en la
clasificación de elementos BIM. Justifica su importancia en la necesidad de
optimizar procesos constructivos mediante la estandarización y reducción de
errores en la gestión de datos. Para el desarrollo del proyecto, se utilizó el
modelo BERT, ajustado para la clasificación de elementos bajo la normativa
ASTM Uniformat II, junto con la herramienta Dynamo para la extracción y
organización de datos. Las técnicas incluyeron la integración de algoritmos de
aprendizaje profundo, procesamiento de datos semánticos y la validación de los
resultados mediante matrices de confusión. Los materiales consistieron en
modelos BIM generados en Revit, y los análisis se realizaron empleando Python
y bibliotecas específicas para NLP. Los resultados mostraron que el modelo
BERT alcanzó una precisión del 48.77% en el nivel 1, pero su desempeño
disminuyó a niveles más detallados, con una precisión del 4.33% en el nivel 4.
Este rendimiento evidenció las limitaciones del modelo en clasificaciones
granulares. Se concluye que el uso de modelos automatizados mejora la
clasificación en niveles generales, pero requiere ajustes para aumentar la
precisión en niveles específicos. Esto refuerza la relevancia del procesamiento
de lenguaje natural en la gestión de información BIM.