|
|
مدلسازی و پیشبینی مکانی کلاس خاک با استفاده از الگوریتم یادگیری رگرسیون درختی توسعهیافته و جنگلهای تصادفی در بخشی از اراضی دشت قزوین
|
|
|
|
|
نویسنده
|
موسوی روح اله ,سرمدیان فریدون ,رحمانی اصغر
|
منبع
|
تحقيقات آب و خاك ايران - 1398 - دوره : 50 - شماره : 10 - صفحه:2525 -2538
|
چکیده
|
انتخاب متغیرهای کمکی مناسب در روش های یادگیرنده ماشینی جهت نقشهبرداری رقومی خاک از اهمیت ویژه ای برخوردار است. طی سال های اخیر در ایران استفاده از الگوریتم های یادگیرنده در نقشه برداری رقومی و بهنگام سازی نقشه های قدیمی توسعه یافته است. پژوهش حاضر در بخشی از اراضی دشت قزوین با هدف مقایسه جنگل های تصادفی (rf) و رگرسیون درختی توسعهیافته (brt) در پیش بینی مکانی کلاس های زیرگروه و فامیل خاک بهمراه انتخاب متغیرهای کمکی با استفاده از شاخص تورم واریانس انجام شده است. 61 خاکرخ به روش نمونه برداری تصادفی طبقهبندیشده حفر، تشریح و با تجزیهوتحلیل آزمایشگاهی تا سطح فامیل رده بندی گردید. مناسبترین متغیر های محیطی از میان 15 متغیر ژئومورفومتری و شاخص های سنجش از دور با استفاده از فاکتور تورم واریانس انتخاب گردیدند. مدل سازی رابطه خاک – زمیننما در دو سطح زیرگروه و فامیل خاک با استفاده از دو الگوریتم یادگیرنده rf و brt در نرمافزار rstudio بر اساس دو بسته randomforest و c5.0 اجرا گردید. نتایج انتخاب متغیر های محیطی نشان داد که شش متغیر cha،dem ، sth، ndvi، si و dvi به عنوان متغیر ورودی انتخاب گردیدند. شاخص های ارزیابی مدل ها شامل صحت کلی و شاخص کاپا به ترتیب برای الگوریتم brt، 35، 26 درصد و برای الگوریتم rf،70، 60 درصد در سطح فامیل خاک حاصل گردید. آنالیز حساسیت برمبنای شاخص میانگین حداقل صحت نشان داد که متغیر محیطی مساحت حوزه آبخیز اصلاحشده دارای بیشترین اهمیت نسبی در میان متغیرهای انتخاب شده است. بهطورکلی با استفاده از رویکردهای نوین انتخاب متغیر و الگوریتمهای یادگیرنده موثر می توان نقشه ی پراکنش مکانی خاک ها را حتی در نواحی با پستیوبلندی کم با صحت قابلقبول تهیه نمود.
|
کلیدواژه
|
نقشه برداری رقومی خاک، الگوریتم یادگیرنده، مدل جنگل تصادفی، درخت تصمیم توسعه یافته، دادهکاوی
|
آدرس
|
دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, دانشکده مهندسی و فناوری کشاورزی, گروه مهندسی علوم خاک, ایران, دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, دانشکده مهندسی و فناوری کشاورزی, گروه مهندسی علوم خاک, ایران, دانشگاه تهران، پردیس کشاورزی ومنابع طبیعی, دانشکده مهندسی و فناوری کشاورزی, گروه علوم ومهندسی خاک, ایران
|
|
|
|
|
|
|
|
|
|
|
Modelling and Prediction of Soil Classes Using Boosting Regression Tree and Random Forests Machine Learning Algorithms in Some Part of Qazvin Plain
|
|
|
Authors
|
Mousavi Sayed Roholla ,Sarmadian Fereydoon ,Rahmani Asghar
|
Abstract
|
Appropriate selection of ancillary covariates have a specific important on digital soil mapping. Currently, use of machine learning algorithms for digital mapping and updating of conventional soil map has been developed in Iran. The current study has been done to compare the BRT and RF models for spatial prediction of subgroup and family classes with selection of axillary variables using VIF approach in some part of Qazvin Plain. 61 pedons were sampled based on stratified random, digged, described and classified with consideration of laboratory analysis up to family level. The most appropriate variables were selected among 15 Geomorphometry and Remote Sensing Indices using Variance Inflation Factor (VIF). Soil landscape modeling was conducted with RF and BRT learning algorithm in RStudio software based on Randomforest and C5.0 packages at subgroup and family levels. The results showed that six indices including CHA, DEM, STH, SI DVI and NDVI were selected as input variables. Assessment indices such as the Overall Accuracy (OA) and Kappa were obtained for BRT (35, 26%) and RF (70, 60%) at family level, respectively. Sensitivity analysis based on the mean decrease accuracy (MDA) revealed that the modified catchment area variable is the most relative important variable among the selected variables. Generally, by using feature selection innovative approach and effective learning algorithms, the spatial distribution of soil maps could be made even in low relief lands with acceptable accuracy.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|