DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.utmachala.edu.ec/handle/48000/20644
Título : Clasificación de la cobertura del suelo en la Provincia del Chimborazo mediante imágenes satelitales y aprendizaje automático
Autor : Quingue Guaminga, Luis Efrain
Director(es): Tusa Jumbo, Eduardo Alejandro
Celleri Pacheco, Jennifer Katherin
Palabras clave : APRENDIZAJE AUTOMATICO;GEE;CART;RF
Fecha de publicación : 2023
Editorial : Machala : Universidad Técnica de Machala
Citación : Quingue, L. Tusa ,E. Célleri, J. (2023), Clasificación de la cobertura del suelo en la Provincia del Chimborazo mediante imágenes satelitales y aprendizaje automático, Universidad Técnica de Machala
Descripción : En la provincia de Chimborazo la falta de información y estudios geográficos realizados es una de las causas de la escaza información respecto a las clases de coberturas de suelo. En el presente trabajo se ha desarrollado los algoritmos de clasificación CART, RF, SVM basado en aprendizaje supervisado de ML e imágenes satelitales S2. El soporte de las TIC ha tenido un rol importante como proveedor de datos y procesamientos en la nube mediante la plataforma GEE. Se ha definido 7 clase de coberturas del suelo: agua, urbano, forestal, cultivo, suelo desnudo, arbustivo y nieve; que se clasifica utilizando 7 de 13 bandas discriminantes de S2, además de los índices NDVI, BSI y RGB para composición del dataset. Con 73% de datos de entrenamiento (1581) y 27% para prueba (598) etiquetados en la plataforma GEE se ha construido los dataset de entrada. Para obtener los clasificadores se aplica las fases de la metodología CRISP-DM que ha permitido desarrollar los tres modelos ML validadas ejecutando tres casos de pruebas para cada uno, donde se determina que los algoritmos RF y SVM alcanzan mejores métricas por encima del ≈80%. Validado los modelos ML aplicando la inferencia estadística se ha realizado el análisis de correlación y prueba de hipótesis, con índice kappa diferente de cero para los tres modelos ML se establece la existencia de concordancia; por lo tanto, se afirma que las imágenes satelitales proporcionan suficiente información discriminatoria. Finalmente, con el análisis y discusión de resultados se determina que el algoritmo RF tiene mejor desempeño en base a los resultados de precisión general ≈88,80% e índice kappa de 0.867. El trabajo finaliza dando pauta a estudios futuros como: comparación de cambios de coberturas e implementación de los modelos ML en sistemas para soporte de decisión,tomando como referencia el presente estudio.
Resumen : In the province of Chimborazo, the lack of information and geographic studies carried out is one of the causes of the lack of information regarding the types of land cover. In the present work, the CART, RF, SVM classification algorithms based on supervised learning of ML and S2 satellite images have been developed. TIC support has played an important role as a provider of data and cloud processing through the GEE platform. 7 classes of land cover have been defined: water, urban, forest, cultivation, bare soil, bushy and snow which is classified using 7 of 13 discriminant bands of S2, in addition to the NDVI, BSI and RGB indices for dataset composition. With 73% of training data (1581) and 27% for testing (598) labeled in the GEE platform, the input datasets have been built. To obtain the classifiers, the phases of the CRISP-DM methodology are applied, which has allowed the development of the three validated ML models, executing three test cases for each one, where it is determined that the RF and SVM algorithms achieve better metrics above ≈80%. Once the ML models have been validated by applying statistical inference, the correlation analysis and hypothesis test have been carried out, with a kappa index different from zero for the three ML models, the existence of concordance is established; therefore, it is claimed that satellite images provide sufficient discriminatory information. Finally, with the analysis and discussion of the results, it is determined that the RF algorithm has a better performance based on the results of general precision ≈88.80% and kappa index of 0.867. The work ends by giving guidelines for future studies such as: comparison of coverage changes and implementation of ML models in decision support systems, taking the present study as a reference.
URI : http://repositorio.utmachala.edu.ec/handle/48000/20644
Aparece en las colecciones: Maestría de Software

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
LUIS QUINGUE - TESIS-signed-signed.pdfTESIS DE MAESTRIA31,99 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons