مدل‌سازی و پیش‌بینی مکانی کلاس خاک با استفاده از الگوریتم یادگیری رگرسیون درختی توسعه‌یافته و جنگلهای تصادفی در بخشی از اراضی دشت قزوین

Fa | Ar | En

مدل‌سازی و پیش‌بینی مکانی کلاس خاک با استفاده از الگوریتم یادگیری رگرسیون درختی توسعه‌یافته و جنگلهای تصادفی در بخشی از اراضی دشت قزوین


نویسنده	موسوی روح اله ,سرمدیان فریدون ,رحمانی اصغر
منبع	تحقيقات آب و خاك ايران - 1398 - دوره : 50 - شماره : 10 - صفحه:2525 -2538
چکیده	انتخاب متغیرهای کمکی مناسب در روش های یادگیرنده ماشینی جهت نقشه‌برداری رقومی خاک از اهمیت ویژه ای برخوردار است. طی سال های اخیر در ایران استفاده از الگوریتم های یادگیرنده در نقشه برداری رقومی و بهنگام سازی نقشه های قدیمی توسعه یافته است. پژوهش حاضر در بخشی از اراضی دشت قزوین با هدف مقایسه جنگل های تصادفی (rf) و رگرسیون درختی توسعه‌یافته (brt) در پیش بینی مکانی کلاس های زیرگروه و فامیل خاک بهمراه انتخاب متغیرهای کمکی با استفاده از شاخص تورم واریانس انجام شده است. 61 خاکرخ به روش نمونه برداری تصادفی طبقه‌بندی‌شده حفر، تشریح و با تجزیه‌وتحلیل آزمایشگاهی تا سطح فامیل رده بندی گردید. مناسب‌ترین متغیر های محیطی از میان 15 متغیر ژئومورفومتری و شاخص های سنجش از دور با استفاده از فاکتور تورم واریانس انتخاب گردیدند. مدل سازی رابطه خاک – زمین‌نما در دو سطح زیرگروه و فامیل خاک با استفاده از دو الگوریتم یادگیرنده rf و brt در نرم‌افزار rstudio بر اساس دو بسته randomforest و c5.0 اجرا گردید. نتایج انتخاب متغیر های محیطی نشان داد که شش متغیر cha،dem ، sth، ndvi، si و dvi به عنوان متغیر ورودی انتخاب گردیدند. شاخص های ارزیابی مدل ها شامل صحت کلی و شاخص کاپا به ترتیب برای الگوریتم brt، 35، 26 درصد و برای الگوریتم rf،70، 60 درصد در سطح فامیل خاک حاصل گردید. آنالیز حساسیت برمبنای شاخص میانگین حداقل صحت نشان داد که متغیر محیطی مساحت حوزه آبخیز اصلاح‌شده دارای بیشترین اهمیت نسبی در میان متغیرهای انتخاب شده است. به‌طورکلی با استفاده از رویکردهای نوین انتخاب متغیر و الگوریتم‌های یادگیرنده موثر می توان نقشه ی پراکنش مکانی خاک ها را حتی در نواحی با پستی‌وبلندی کم با صحت قابل‌قبول تهیه نمود.
کلیدواژه	نقشه برداری رقومی خاک، الگوریتم یادگیرنده، مدل جنگل تصادفی، درخت تصمیم توسعه یافته، داده‌کاوی
آدرس	دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, دانشکده مهندسی و فناوری کشاورزی, گروه مهندسی علوم خاک, ایران, دانشگاه تهران، پردیس کشاورزی و منابع طبیعی, دانشکده مهندسی و فناوری کشاورزی, گروه مهندسی علوم خاک, ایران, دانشگاه تهران، پردیس کشاورزی ومنابع طبیعی, دانشکده مهندسی و فناوری کشاورزی, گروه علوم ومهندسی خاک, ایران

Modelling and Prediction of Soil Classes Using Boosting Regression Tree and Random Forests Machine Learning Algorithms in Some Part of Qazvin Plain

Authors	Mousavi Sayed Roholla ,Sarmadian Fereydoon ,Rahmani Asghar
Abstract	Appropriate selection of ancillary covariates have a specific important on digital soil mapping. Currently, use of machine learning algorithms for digital mapping and updating of conventional soil map has been developed in Iran. The current study has been done to compare the BRT and RF models for spatial prediction of subgroup and family classes with selection of axillary variables using VIF approach in some part of Qazvin Plain. 61 pedons were sampled based on stratified random, digged, described and classified with consideration of laboratory analysis up to family level. The most appropriate variables were selected among 15 Geomorphometry and Remote Sensing Indices using Variance Inflation Factor (VIF). Soil landscape modeling was conducted with RF and BRT learning algorithm in RStudio software based on Randomforest and C5.0 packages at subgroup and family levels. The results showed that six indices including CHA, DEM, STH, SI DVI and NDVI were selected as input variables. Assessment indices such as the Overall Accuracy (OA) and Kappa were obtained for BRT (35, 26%) and RF (70, 60%) at family level, respectively. Sensitivity analysis based on the mean decrease accuracy (MDA) revealed that the modified catchment area variable is the most relative important variable among the selected variables. Generally, by using feature selection innovative approach and effective learning algorithms, the spatial distribution of soil maps could be made even in low relief lands with acceptable accuracy.
Keywords