مدل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌سازی پراکنش مکانی کلاس‌های خاک با استفاده از الگوریتم‌های یادگیری ماشین در بخشی از اراضی استان زنجان

Fa | Ar | En

مدل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌سازی پراکنش مکانی کلاس‌های خاک با استفاده از الگوریتم‌های یادگیری ماشین در بخشی از اراضی استان زنجان


نویسنده	رحیمی مشکله مستانه ,دلاور محمد امیر ,جمشیدی محمد ,شریفی فر امین
منبع	پژوهش هاي خاك (علوم خاك و آب) - 1402 - دوره : 37 - شماره : 2 - صفحه:147 -165
چکیده	نقشه برداری رقومی از روش های نوینی است که از الگوریتم های یادگیری ماشین و متغیرهای محیطی پیروی کرده و به دلیل صرفه جویی در زمان و هزینه انجام مطالعه برای پهنه‌بندی خصوصیات و کلاس‌های خاک در سطوح مختلف طبقه بندی کاربرد گسترده ای در سطح جهانی دارد. این پژوهش باهدف مقایسه کارایی مدل‌های یادگیری ماشین در پیش‌بینی مکانی زیرگروه های خاک در بخشی از اراضی استان زنجان انجام شد. برای این منظور، بر اساس الگوی طبقه‌بندی تصادفی با میانگین فاصله 500 متر، 148 خاک رخ حفر و تشریح گردید و مطابق با سامانه جامع رده بندی خاک به روش آمریکایی طبقه بندی شد. خاک ها در سطح زیرگروه در پنج کلاس تیپیک کلسی زرپتز، تیپیک هاپلوزرپتز، جیپسیک هاپلوزرپتز، تیپیک زراورتنتز و لیتیک زراورتنتز طبقه‌بندی شد. متغیرهای محیطی شامل نقشه های ژئومورفولوژی، زمین شناسی، توپوگرافی و داده های حاصل از تصاویر سنجش‌ازدور بود. 57 متغیر محیطی به‌عنوان نمایندگان عوامل خاک سازی استخراج گردید و با استفاده از روش تحلیل مولفه اصلی و نظر کارشناسان، موثرترین متغیرهای محیطی انتخاب شد. مدل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌سازی خاک - زمین نما با استفاده از الگوریتم های جنگل تصادفی، درخت تصمیم توسعه‌یافته و رگرسیون لجستیک چندجمله‌ای در محیط نرم افزار rstudio انجام شد. صحت کلی و ضریب کاپا برای ارزیابی کلاس های خاک در سطح زیرگروه به ترتیب در مدل رگرسیون لجستیک چندجمله ای 65% و 0/41%، در مدل جنگل تصادفی 65% و 0/32 و در مدل درخت تصمیم توسعه‌یافته 60% و 0/35 به دست آمد. صحت کاربر و صحت تولیدکننده نشان داد که مدل رگرسیون لجستیک چندجمله ای برآورد قابل قبولی در پیش‌بینی مکانی زیرگروه های خاک ارائه می دهد. متغیرهای عمق دره، فاصله تا شبکه آبراهه، شاخص همواری بالای پشته با درجه تفکیک بالا و شاخص طول در جهت شیب دارای بیش‌ترین اهمیت در مدل رگرسیون لجستیک چندجمله ای بود. کلاس های خاک با فراوانی بیشتر صحت بالاتری داشت. که نشان می دهد رابطه مستقیمی بین فراوانی کلاس های خاک در داده های آموزشی با صحت نتایج پیش بینی کلاس های خاک برقرار است.
کلیدواژه	رگرسیون لجستیک چندجمله‌ای، ضریب کاپا، نقشه برداری رقومی خاک، ویژگی‌های توپوگرافی
آدرس	دانشگاه زنجان, دانشکده کشاورزی, گروه علوم خاک, ایران, دانشگاه زنجان, دانشکده کشاورزی, گروه علوم خاک, ایران, سازمان تحقیقات، آموزش و ترویج کشاورزی, موسسه تحقیقات خاک و آب, ایران, دانشگاه تهران، پردیس کشاورزی, گروه علوم خاک, ایران
پست الکترونیکی	sharififar@ut.ac.ir

modeling spatial distribution of soil classes using machine learning algorithms in some parts of zanjan provice

Authors	rahimi moshkeleh mastaneh ,amirdelavar mohammad ,jamshidi mohammad ,sharififar amin
Abstract	digital soil mapping (dsm), which uses machine learning (ml) algorithms and environmental covariates, is used worldwide for predicting soil properties and classes, due to being time-effective and cost-saving. this research was conducted to compare ml models and their efficiency in predicting the spatial distribution of soil subgroups in part of zanjan province. for this purpose, sampling was carried out through a regular pattern with 500 meters intervals, and 148 soil profile samples were randomly collected and classified. the soils of the region at the subgroup level were categorized in five classes, including typic calcixerepts, typic haploxerepts, gypsic haploxerepts, typic xerorthents, and lithic xerorthents. environmental covariates included geomorphological and geological maps, digital elevation model (dem), and remote sensing (rs), selected by principal component analysis (pca) and expert knowledge approaches. fifty-seven environmental variables were extracted as representatives of soil forming factors. modeling of the soil-landscape relationship was performed using three algorithms, namely, multinomial logistic regression (mnlr), random forest (rf), and boosted regression tree (brt) in rstudio software. the results of evaluation metrics such as overall accuracy and kappa index were 65% and 0.32 for the rf algorithm, 60% and 0.35 for the brt, and 65% and 0.41 for the mnlr. referring to the importance of environmental variables, results showed that the four factors of valley depth, ls-factor, channel network distance, and multiple resolution ridge top flatness index (mrrtf) were the most important variables in mnlr algorithm. also, the results of two statistics of user’s accuracy (ua) and producer’s accuracy (pa) showed that the mnlr model performed better in the spatial prediction of soil at subgroup level. soil classes with higher frequency had higher accuracy. the results of the prediction accuracy of soil classes showed that the model prediction is more accurate for the more frequent types in the observations.
Keywords	multinomial logistic regression ,kappa index ,digital soil mapping ,terrain attributes