|
|
مدلسازی پراکنش مکانی کلاسهای خاک با استفاده از الگوریتمهای یادگیری ماشین در بخشی از اراضی استان زنجان
|
|
|
|
|
نویسنده
|
رحیمی مشکله مستانه ,دلاور محمد امیر ,جمشیدی محمد ,شریفی فر امین
|
منبع
|
پژوهش هاي خاك (علوم خاك و آب) - 1402 - دوره : 37 - شماره : 2 - صفحه:147 -165
|
چکیده
|
نقشه برداری رقومی از روش های نوینی است که از الگوریتم های یادگیری ماشین و متغیرهای محیطی پیروی کرده و به دلیل صرفه جویی در زمان و هزینه انجام مطالعه برای پهنهبندی خصوصیات و کلاسهای خاک در سطوح مختلف طبقه بندی کاربرد گسترده ای در سطح جهانی دارد. این پژوهش باهدف مقایسه کارایی مدلهای یادگیری ماشین در پیشبینی مکانی زیرگروه های خاک در بخشی از اراضی استان زنجان انجام شد. برای این منظور، بر اساس الگوی طبقهبندی تصادفی با میانگین فاصله 500 متر، 148 خاک رخ حفر و تشریح گردید و مطابق با سامانه جامع رده بندی خاک به روش آمریکایی طبقه بندی شد. خاک ها در سطح زیرگروه در پنج کلاس تیپیک کلسی زرپتز، تیپیک هاپلوزرپتز، جیپسیک هاپلوزرپتز، تیپیک زراورتنتز و لیتیک زراورتنتز طبقهبندی شد. متغیرهای محیطی شامل نقشه های ژئومورفولوژی، زمین شناسی، توپوگرافی و داده های حاصل از تصاویر سنجشازدور بود. 57 متغیر محیطی بهعنوان نمایندگان عوامل خاک سازی استخراج گردید و با استفاده از روش تحلیل مولفه اصلی و نظر کارشناسان، موثرترین متغیرهای محیطی انتخاب شد. مدلسازی خاک - زمین نما با استفاده از الگوریتم های جنگل تصادفی، درخت تصمیم توسعهیافته و رگرسیون لجستیک چندجملهای در محیط نرم افزار rstudio انجام شد. صحت کلی و ضریب کاپا برای ارزیابی کلاس های خاک در سطح زیرگروه به ترتیب در مدل رگرسیون لجستیک چندجمله ای 65% و 0/41%، در مدل جنگل تصادفی 65% و 0/32 و در مدل درخت تصمیم توسعهیافته 60% و 0/35 به دست آمد. صحت کاربر و صحت تولیدکننده نشان داد که مدل رگرسیون لجستیک چندجمله ای برآورد قابل قبولی در پیشبینی مکانی زیرگروه های خاک ارائه می دهد. متغیرهای عمق دره، فاصله تا شبکه آبراهه، شاخص همواری بالای پشته با درجه تفکیک بالا و شاخص طول در جهت شیب دارای بیشترین اهمیت در مدل رگرسیون لجستیک چندجمله ای بود. کلاس های خاک با فراوانی بیشتر صحت بالاتری داشت. که نشان می دهد رابطه مستقیمی بین فراوانی کلاس های خاک در داده های آموزشی با صحت نتایج پیش بینی کلاس های خاک برقرار است.
|
کلیدواژه
|
رگرسیون لجستیک چندجملهای، ضریب کاپا، نقشه برداری رقومی خاک، ویژگیهای توپوگرافی
|
آدرس
|
دانشگاه زنجان, دانشکده کشاورزی, گروه علوم خاک, ایران, دانشگاه زنجان, دانشکده کشاورزی, گروه علوم خاک, ایران, سازمان تحقیقات، آموزش و ترویج کشاورزی, موسسه تحقیقات خاک و آب, ایران, دانشگاه تهران، پردیس کشاورزی, گروه علوم خاک, ایران
|
پست الکترونیکی
|
sharififar@ut.ac.ir
|
|
|
|
|
|
|
|
|
modeling spatial distribution of soil classes using machine learning algorithms in some parts of zanjan provice
|
|
|
Authors
|
rahimi moshkeleh mastaneh ,amirdelavar mohammad ,jamshidi mohammad ,sharififar amin
|
Abstract
|
digital soil mapping (dsm), which uses machine learning (ml) algorithms and environmental covariates, is used worldwide for predicting soil properties and classes, due to being time-effective and cost-saving. this research was conducted to compare ml models and their efficiency in predicting the spatial distribution of soil subgroups in part of zanjan province. for this purpose, sampling was carried out through a regular pattern with 500 meters intervals, and 148 soil profile samples were randomly collected and classified. the soils of the region at the subgroup level were categorized in five classes, including typic calcixerepts, typic haploxerepts, gypsic haploxerepts, typic xerorthents, and lithic xerorthents. environmental covariates included geomorphological and geological maps, digital elevation model (dem), and remote sensing (rs), selected by principal component analysis (pca) and expert knowledge approaches. fifty-seven environmental variables were extracted as representatives of soil forming factors. modeling of the soil-landscape relationship was performed using three algorithms, namely, multinomial logistic regression (mnlr), random forest (rf), and boosted regression tree (brt) in rstudio software. the results of evaluation metrics such as overall accuracy and kappa index were 65% and 0.32 for the rf algorithm, 60% and 0.35 for the brt, and 65% and 0.41 for the mnlr. referring to the importance of environmental variables, results showed that the four factors of valley depth, ls-factor, channel network distance, and multiple resolution ridge top flatness index (mrrtf) were the most important variables in mnlr algorithm. also, the results of two statistics of user’s accuracy (ua) and producer’s accuracy (pa) showed that the mnlr model performed better in the spatial prediction of soil at subgroup level. soil classes with higher frequency had higher accuracy. the results of the prediction accuracy of soil classes showed that the model prediction is more accurate for the more frequent types in the observations.
|
Keywords
|
multinomial logistic regression ,kappa index ,digital soil mapping ,terrain attributes
|
|
|
|
|
|
|
|
|
|
|