>
Fa   |   Ar   |   En
   واسنجی بارش روزانه era5 با استفاده از الگوریتم‌های mlp، d-tree و knn در استان خراسان‌رضوی  
   
نویسنده رجبی جاغرق مجید ,موسوی بایگی محمد ,عراقی علیرضا ,جباری نوقابی هادی
منبع سامانه هاي سطوح آبگير باران - 1403 - دوره : 12 - شماره : 1 - صفحه:129 -147
چکیده    محصولات ماهواره‌ای تنها منبع داده موجود با پوشش فضایی مناسب است، با این وجود، داده‌های آن‌ها بر مقادیر مشاهداتی منطبق نبوده و دارای انحراف است، هرچند این عدم تطابق به‌طور دقیق قابل رفع نیست، با این حال، یک راه‌حل کاهش سوگیری، واسنجی داده‌هاست. در حال حاضر، تکنیک‌های یادگیری ماشین برای بهبود دقت پیش‌بینی انواع مختلف پدیده‌های آب و هوایی به کار گرفته می‌شوند، لذا حل رگرسیونی مسائلی از این قبیل از طریق روش‌های مبتنی بر یادگیری ماشین و آموزش عمیق بسیار کارآمد است. باراش روزانه 19 ایستگاه باران‌سنج ثبات وزارت نیرو بین سال‌های 2010 تا 2021 میلادی استخراج شد و در مقابل مقادیر متوسط پیکسل‌های بارش روزانه متناظر آن‌ها در پایگاه داده era5 قرارگرفت. به‌منظور واسنجی داده‌ها، از سه الگوریتم d-tree، knn و mlp استفاده شد. دامنه تغییرات ضریب همبستگی در mlp، d-tree و knn به‌ترتیب برابر [0.87, 0.98]، [0.75, 0.97] و [0.4, 0.87] است. هم‌چنین این دامنه تغییرات برای rmse در mlp بین 0.7 تا 2.4 میلی‌متر در روز متغیر بوده و این تغییرات برای d-tree و knn به‌ترتیب بین 0.8 تا 2.2 و 1.2 تا 2.5 محاسبه شده‌اند. در 75 درصد ایستگاه‌ها rmse در الگوریتم‌های mlp، d-tree و knnبه‌ترتیب کم‌تر از 1.5، 1.9 و 2.2 میلی‌متر در روز است. دامنه تغییرات سوگیری در mlp، [0.18، 0.6- میلی‌متر در روز] بوده و این دامنه تغییرات برای d-tree و knn به‌ترتیب [0.16، 0.5 میلی‌متر در روز] و [0.6، 0.8- میلی‌متر در روز] محاسبه شده‌اند. سوگیری داده‌های اصلاحی و مقادیر مشاهده شده، در الگوریتم‌های mlp، d-tree و knn برای میانه ایستگاه‌ها به‌ترتیب برابر 0.09-، 0.11- و 0.16- میلی‌متر در روز است. ارزیابی عملکرد سه الگوریتم یادگیری ماشین (mlp، d-tree و knn) در تصحیح بارش روزانه پایگاه داده era5 و ‌مقایسه شاخص‌های آماری cc، rmse و سوگیری برای داده‌های بازتولید شده نسبت به مقادیر زمینی نشان داد که در هر سه شاخص آماری الگوریتم mlp نسبت به دوالگوی دیگر بهتر عمل نموده و از دقت مناسبی برای تصحیح بارش روزانه برخوردار است.
کلیدواژه پایگاه داده، شاخص‌های آماری، یادگیری ماشین، واسنجی
آدرس دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم و مهندسی آب, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم و مهندسی آب, ایران, دانشگاه فردوسی مشهد, دانشکده کشاورزی, گروه علوم ومهندسی آب, ایران, دانشگاه فردوسی مشهد, دانشکده علوم ریاضی, گروه آمار, ایران
پست الکترونیکی jabarimh@um.ac.ir
 
   calibration of era5 daily precipitation using mlp, d-tree, and knn algorithms in razavi khorasan province  
   
Authors rajabi jaghargh majid ,mousavi baygi mohammad ,araghi alireza ,jabari noghabi hadi
Abstract    satellite products are the only available data source with adequate spatial coverage, however, their data do not match the observed values ​​and have biases, although this discrepancy cannot be fixed precisely, however, a solution to reduce the bias is data recalibration. currently, machine learning techniques are used to improve the accuracy of forecasting various types of weather phenomena, so regression solving such problems through methods based on machine learning and deep learning is very efficient. the daily precipitation of 19 rain gauge stations of the ministry of energy between 2010 and 2021 was extracted and compared to the average values ​​of their corresponding daily precipitation pixels in the era5 database. to measure the data, three algorithms d-tree, knn, and mlp were used. the range of changes of correlation coefficient in mlp, d-tree, and knn is equal to [0.87, 0.98], [0.75, 0.97], and [0.4, 0.87], respectively. in addition, the range of changes for rmse in mlp varies from 0.7 to 2.4 mm per day, and these changes for d-tree and knn are calculated between 0.8 to 2.2 and 1.2 to 2.5, respectively. in 75% of stations, rmse in mlp, d-tree, and knn algorithms is less than 1.5, 1.9, and 2.2 mm per day, respectively. the range of bias changes in mlp is [0.18, -0.6 mm per day] and this range of changes for d-tree and knn is respectively [0.16, 0.5 mm per day] and [0.6, -0.8 mm per day] have been calculated. the bias of corrected data and observed values ​​in mlp, d-tree, and knn algorithms for the middle of the stations is -0.09, -0.11, and -0.16 mm per day, respectively. the evaluation of the performance of three machine learning algorithms (mlp, d-tree, and knn) in correcting the daily precipitation of the era5 database and the comparison of cc, rmse, and bias statistical indices for the reproduced data compared to ground values ​​showed that in all three statistical indices, the mlp algorithm works better than the others and has good accuracy for correcting the daily precipitation.
Keywords calibration ,database ,statistical indicators ,machine learning
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved