Please use this identifier to cite or link to this item: https://dspace.sti.ufcg.edu.br/handle/riufcg/43471
Title: Estimativa da evapotranspiração real diária na caatinga usando algoritmos de aprendizado de máquina e dados meteorológicos.
Other Titles: Estimation of real daily evapotranspiration in the caatinga using machine learning algorithms and meteorological data.
???metadata.dc.creator???: SILVA , Alberto César do Nascimento.
???metadata.dc.contributor.advisor1???: SANTOS, Carlos Antonio Costa dos.
???metadata.dc.contributor.referee1???: SOUZA, Enio Pereira de.
???metadata.dc.contributor.referee2???: ALCÂNTARA, Hugo Morais de.
???metadata.dc.contributor.referee3???: DANTAS NETO, José.
???metadata.dc.contributor.referee4???: XAVIER JÚNIOR, Sílvio Fernando Alves.
Keywords: Evapotranspiração;Técnicas de medição;Caatinga;Região Semiárida – Nordeste - Brasil;Aprendizado de máquina;Evapotranspiration;Measurement techniques;Caatinga;Semiarid region – Northeast – Brazil;Machine learning
Issue Date: 25-Aug-2025
Publisher: Universidade Federal de Campina Grande
Citation: SILVA, Alberto César do Nascimento. Estimativa da evapotranspiração real diária na caatinga usando algoritmos de aprendizado de máquina e dados meteorológicos. 2025. 82 f. Tese (Doutorado em Engenharia e Gestão de Recursos Naturais) – Programa de Pós-Graduação em Engenharia e Gestão de Recursos Naturais, Centro de Tecnologia e Recursos Naturais, Universidade Federal de Campina Grande, Paraíba, Brasil, 2025.
???metadata.dc.description.resumo???: Neste estudo, foram desenvolvidos e avaliados modelos de regressão com o objetivo de prever a evapotranspiração real diária (ET) na região semiárida do Nordeste Brasileiro (NEB), utilizando dados provenientes de estações meteorológicas. Para tal, foram implementados seis algoritmos de aprendizado de máquina: Naïve Bayes (NB), Random Forest (RF), CN2, kNearest Neighbor (kNN), Support Vector Machine (SVM) e Artificial Neural Network (ANN). As variáveis de entrada utilizadas nos modelos foram: precipitação total diária (PPT), temperatura média diária do ar (Ta), umidade relativa média diária do ar (RH), déficit médio diário de pressão de vapor (VPD), velocidade horizontal média diária do vento (WND), radiação solar média diária (Rs) e temperatura média diária do solo (Ts). O período de análise compreendeu os anos de 2013 a 2016, em dois sítios experimentais sob diferentes condições de cobertura vegetal: Caatinga Restaurada (CR) e Caatinga Degradada (CD), a partir de dados micrometeorológicos. A avaliação do desempenho dos modelos foi realizada por meio de diferentes métricas estatísticas: raiz do erro médio quadrático (RMSE), erro médio absoluto (MAE), erro percentual absoluto médio simétrico (SMAPE), erro médio quadrático relativo (rRMSE), viés e coeficiente de determinação (R²). Os resultados demonstraram que o modelo RF apresentou o melhor desempenho em ambas as áreas avaliadas, com valores de RMSE de 0,80 mm/dia para CR e 1,56 mm/dia para CD, correspondendo a rRMSE de apenas 4% e 5%, respectivamente. Tais resultados evidenciam que tanto o estado de conservação da vegetação quanto a seleção adequada do modelo preditivo constituem fatores determinantes para a regulação e a estimativa confiável da ET no semiárido brasileiro. Na análise conjunta dos dados, desconsiderando-se a condição de conservação da vegetação, o modelo RF novamente apresentou melhor desempenho, com RMSE de 1,27 mm/dia e rRMSE de 3%. Com vistas à redução da complexidade do modelo, à ampliação de sua aplicabilidade e à diminuição do tempo de treinamento, foram conduzidas novas simulações com o RF, empregando um número reduzido de variáveis de entrada. Observou-se que, ao utilizar seis variáveis (PPT, RH, VPD, WND, Rs e Ts), o modelo manteve, e até mesmo superou ligeiramente, sua eficiência preditiva, apresentando RMSE de 1,26 mm/dia e rRMSE de 3%. A análise de importância das variáveis, conduzida a partir da deterioração do desempenho do modelo, indicou que PPT e RH são as mais relevantes para a previsão da ET, enquanto Ta e WND apresentaram menor impacto sobre a capacidade preditiva do RF no contexto do semiárido brasileiro.
Abstract: In this study, regression models were developed and evaluated to predict actual daily evapotranspiration (ET) in the semiarid region of Northeast Brazil (NEB) using data from meteorological stations. Six machine learning algorithms were implemented: Naïve Bayes (NB), Random Forest (RF), CN2, k-Nearest Neighbor (kNN), Support Vector Machine (SVM), and Artificial Neural Network (ANN). The input variables used in the models were total daily precipitation (PPT), mean daily air temperature (Ta), mean daily relative humidity (RH), mean daily vapor pressure deficit (VPD), mean daily horizontal wind speed (WND), mean daily solar radiation (Rs), and mean daily soil temperature (Ts). The analysis covered the period from 2013 to 2016 at two experimental sites with different vegetation cover conditions: Restored Caatinga (CR) and Degraded Caatinga (CD), based on micrometeorological data. Model performance was assessed using several statistical metrics: root mean square error (RMSE), mean absolute error (MAE), symmetric mean absolute percentage error (SMAPE), relative root mean square error (rRMSE), bias, and coefficient of determination (R²). The results showed that the RF model performed best at both sites, with RMSE values of 0.80 mm/day for CR and 1.56 mm/day for CD, corresponding to rRMSEs of only 4% and 5%, respectively. These findings highlight that both vegetation conservation status and the appropriate selection of predictive models are determining factors for the regulation and reliable estimation of ET in the Brazilian semiarid region. In the joint analysis of the data, disregarding vegetation conservation status, the RF model again achieved the best performance, with an RMSE of 1.27 mm/day and an rRMSE of 3%. To reduce model complexity, broaden its applicability, and shorten training time, additional simulations were conducted with the RF model using a reduced number of input variables. Results indicated that, with six variables (PPT, RH, VPD, WND, Rs, and Ts), the model maintained—and even slightly improved—its predictive efficiency, achieving an RMSE of 1.26 mm/day and an rRMSE of 3%. The variable importance analysis, based on performance deterioration, revealed that PPT and RH are the most relevant predictors of ET, while Ta and WND had comparatively less influence on the RF model’s predictive ability in the Brazilian semiarid region.
Keywords: Evapotranspiração
Técnicas de medição
Caatinga
Região Semiárida – Nordeste - Brasil
Aprendizado de máquina
Evapotranspiration
Measurement techniques
Caatinga
Semiarid region – Northeast – Brazil
Machine learning
???metadata.dc.subject.cnpq???: Engenharia e Gestão de Recursos Naturais.
URI: https://dspace.sti.ufcg.edu.br/handle/riufcg/43471
Appears in Collections:Doutorado em Engenharia e Gestão de Recursos Naturais.

Files in This Item:
File Description SizeFormat 
ALBERTO CÉSAR DO NASCIMENTO SILVA - TESE (PPGRN) 2025.pdf2.36 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.