Abstract | dc.description.abstract | Actualmente, la incorporación de técnicas de Machine Learning se ha posicionado como una estrategia clave para transitar hacia una minería más verde y tecnológica. Si bien existen variadas técnicas, el éxito en la implementación de estas depende de las características de los datos, los objetivos y necesidades del estudio. Por otro lado, en el yacimiento Los Bronces, la identificación del contacto entre la zona primaria y secundaria es fundamental para optimizar el procesamiento y la extracción del mineral. Este contacto marca la transición entre roca primaria más competente y con mayor mineralización hipógena y una roca secundaria más fracturada. Así, este trabajo tiene como objetivo evaluar y comparar modelos de machine learning para predecir el contacto entre la zona primaria y secundaria del yacimiento Los Bronces a partir de espectros de reflectancia.
Se comparan cuatro modelos supervisados (Random Forest (RF), Support Vector Machine (SVM), Logistic Regression (LR), Neural Network (NN)) y un modelo no supervisado (K-means). La metodología de preprocesamiento incluye tres escenarios y busca minimizar las distorsiones en los espectros de reflectancia hacia longitudes de onda extremas. Los modelos se construyen con datos de los laboratorios de Perth y Santiago. También, se propone un método de búsqueda doble de hiperparámetros para los modelos supervisados, utilizando primero RandomizedSearchCV y luego GridSearchCV. Posteriormente, se evalúan métricas de rendimiento como exactitud, precisión, recall, f1-score, matriz de confusión, homogeneidad, completitud y v-measure.
Los modelos LR, SVM y NN mostraron mejor rendimiento, alcanzando métricas de exactitud, precisión, recall y f1-score sobre el 90% en la mayoría de los casos. Por otro lado, K-means no fue capaz de capturar la complejidad de los datos, con métricas cercanas a 0 y llegando a clasificar más de la mitad de los datos erróneamente. En cuanto a RF, no presentó mejores métricas que los otros modelos supervisados y no se recomienda su uso dado su alto costo computacional. Por otro lado, el escenario 1 presentó las métricas más bajas, mientras que el escenario 2 presentó los mejores resultados, seguido del 3, por lo que los modelos son robustos incluso con espectros que presentan valores negativos y reflectancias superiores a 1. Además, la primera búsqueda con RandomizedSearchCV demostró ser suficiente en la mayoría de los casos.
Finalmente, se recomienda para investigaciones futuras añadir una componente litológica a la caracterización de los dominios, ya que se identificó alta presencia de BXA, BXBM y BXPR en el dominio primario. | es_ES |