>
Fa   |   Ar   |   En
   بهره گیری از رویکرد بوت استرپ برای مقایسه روش های مدل سازی آماری در برآورد سنجش ازدوری زی توده روی زمینی جنگل های زاگرس  
   
نویسنده صفری امیر ,سهرابی هرمز
منبع سنجش از دور و سامانه اطلاعات جغرافيايي در منابع طبيعي - 1399 - دوره : 11 - شماره : 2 - صفحه:49 -67
چکیده    پیشینه و هدف با توجه به اهمیت اکوسیستم های جنگل ها در پروژه های تعدیل تغییر اقلیم، روش های دقیق و کم‌هزینه برای برآورد زی توده روی زمینی موردنیاز است. روش های معمول مورد استفاده برای برآورد زی توده روی زمینی شامل اندازه گیری در عرصه، محاسبه زی توده با استفاده از معادلات آلومتری و استفاده از فنون سنجش از دوری است. سنجش از دور به طور گسترده برای برآورد زی توده جنگل ها در دهه های اخیر مورد استفاده قرارگرفته است. یکی از عوامل بسیار مهم در استفاده از داده های سنجش از دوری برای برآورد زی توده روی زمینی روش مدل سازی آماری مورد استفاده است. تعداد زیادی تحقیق در زمینه استفاده از روش های مدل سازی انجام شده است. به هرحال، این مطالعات با چالش های مختلفی روبرو هستند که برای مثال می توان به موارد زیر اشاره کرد: 1) هیچ روش مدل سازی به عنوان بهترین روش معرفی نشده است، 2) عملکرد این روش ها متاثر از نوع جنگل، ساختار جنگل و میزان آشفتگی های موجود است. 3) ارزیابی عملکرد و مقایسه نتایج آن ها با استفاده از آزمون نکویی برازش و روش های ارزیابی متقابل انجام گرفته است. با توجه به نقش انتخاب روش مدل سازی مناسب، مطالعه حاضر باهدف بررسی نه روش مدل سازی شامل رگرسیون خطی، مدل تجمعی تعمیم یافته، جنگل تصادفی، ماشین بردارپشتیبان، درختان رگرسیون تقویت‌شده، kامین نزدیک‌ترین همسایه، مدل پردازش گوسی و رگرسیون اسپلاین تطبیقی چندگانه با استفاده از فرآیند بوت استرپ برای برآورد زی توده روی زمینی جنگل های زاگرس با استفاده از تصویرهای لندست 8 انجام شد. مواد و روش ها مطالعه حاضر در جنگل های کرمانشاه که در غرب ایران درکوه های زاگرس واقع شده است با گونه درختی غالب بلوط انجام شد. جنگل های زاگرس اغلب به صورت تنک و باز بوده و حدود 20 درصد از سطح ایران و 40 درصد از مناطق جنگلی این کشور را شامل می شود. برای اجرای این مطالعه دو منطقه جنگلی با شدت دخالت‌های انسانی مختلف انتخاب شد: منطقه سرفیروزآباد با شدت تخریب بالا و منطقه جنگلی گهواره با حداقل تخریب. مختصات جغرافیایی این مناطق به ترتیب برای سرفیروزآباد و گهواره عبارتند از 33 درجه و 57 دقیقه تا 34 درجه و 4 دقیقه شمالی و 47 درجه و 3 دقیقه تا 47 درجه و 17 دقیقه شرقی، و 34 درجه 21 دقیق تا 34 درجه و 24 دقیقه شمالی و 46 درجه و 16 دقیق تا 46 درجه و 23 دقیق شرقی است. برای جمع آوری نمونه های زمینی در دو منطقه مورد مطالعه، از نقشه شاخص سطح برگ تهیه شده از تصویرهای لندست براساس مدل جهانی استفاده شد. هر دو منطقه به سه طبقه کم، متوسط و زیاد شاخص سطح برگ طبقه بندی شده و در هر طبقه موقعیت مکانی نمونه ها با استفاده از آماربرداری منظم در قالب یک شبکه 200×200 متر مشخص گردید. نمونه های زمینی به تعداد 124 نمونه مربعی شکل (63 نمونه در منطقه گهواره و 61 نمونه در منطقه سرفیروزآباد) با ابعاد 30×30 متر به اندازه پیکس ل های تصویر لندست مورد استفاده برداشت شد. مقدار زی توده روی زمینی هر درخت یا جست گروه توسط معادله آلومتری پیشنهاد شده برای گونه های بلوط جنگل های زاگرس محاسبه شد. معادله آلومتری مورد استفاده برای برآورد اندوخته زی توده هر درخت یا جست گروه از دو قطر عمود بر هم تاج درختان استفاده می کند. از جمع اندوخته زی توده تک تک درختان موجود در قطعه نمونه، مقدار قطعه زی توده در سطح قطعه نمونه بر حسب تن در هکتار محاسبه شد. منطقه های مورد مطالعه در یک فریم از تصویرهای لندست 8 به شماره گذر 167 و شماره ردیف 36 قرار داشتند. یک تصویر لندست بدون پوشش ابرناکی مربوط به تاریخ 19 مرداد سال 1394 (10 آگوست 2015) مربوط به زمانی که تاجدرختان کاملاً بسته بوده و نزدیک به زمان آماربرداری زمینی از سایت usgs دانلود شد. پیش پردازش تصویر مورد استفاده شامل تصحیحات رادیومتری و توپوگرافی به روش c اعمال شد که در مطالعات قبلی پیشنهاد شده است. برای برآورد زی توده روی زمینی در منطقه های مورد مطالعه با استفاده از سنجش از دور، تعداد 38 متغیر طیفی شامل مقدار های باندی، نسبت های ساده باندی، شاخص های گیاهی و تبدیل های خطی رایج مانند تسلدکپ و آنالیز مولفه های اصلی از تصویر لندست 8 مورد استفاده استخراج شدند. به‌طورکلی کارایی 9 روش مدل سازی آماری مختلف شامل روش های پارامتری (رگرسیون خطی)، نیمه پارامتری (مدل جمعی تعمیم یافته) و ناپارامتری (جنگل تصادفی، ماشین بردار پشتیبان، kامین نزدیک ‌ترین همسایه، درختان رگرسیون تقویت ‌شده، رگرسیون اسپلاین تطبیقی چندمتغیره، کوبیست و مدل پردازش گوسی) برای برآورد زی توده روی زمینی مورد مقایسه قرار گرفت. ارزیابی مدل ها با استفاده از روش fold10 و با 1000 مرتبه تکرار و با محاسبه دو آماره ضریب تبیین و جذر میانگین مربعات خطا انجام گرفت. این تعداد اطمینان از پایداری نتایج را تامین می‌کند. نتایج و بحث مشخصه های آماری اندازه گیری شده از قطعه نمونه های زمینی نشان داد که میانگین زی توده روی زمینی برای منطقه های سرفیروزآباد و گهواره به ترتیب 12.6 و 20.5 تن در هکتار است. تجزیه واریانس نشان داد که اختلاف معنی داری در سطح 0.001 برای مشخصه های ضریب تبیین و جذر میانگین مربعات خطای محاسبه شده برای 1000 مرتبه تکرار توسط fold10 وجود دارد. روش مدل سازی کوبیست در منطقه سرفیروزآباد با میانگین ضریب تبیین محاسبه شده 0.61 نتایج بهتری نسبت به سایر روش ها ارائه کرد. این نتایج برای منطقه گهواره بیانگر کارایی بهتر روش های رگرسیون خطی، مدل جمعی تعمیم یافته و kامین نزدیکتریین همسایه با میانگین ضریب تبیین 0.87 بود. مقایسه های روش های مختلف مدل سازی در مورد جذرمیانگین مربعات خطای برآوردها با استفاده از آزمون تکی tukey نشان داد که در منطقه سرفیروزآباد روش کوبیست با مقدار میانگین 3.3 تن در هکتار و روش های kامین نزدیکترین همسایه و جنگل تصادفی با میانگین 5.8 تن در هکتار اختلاف معنی داری با سایر روش ها داشت. به طورکلی، نتایج این تحقیق بیانگر کارایی مناسب تصویر لندست 8 در برآورد زی توده روی زمینی جنگل های زاگرس است. این موضوع می تواند به دلیل مقدار کم زی توده در منطقه های مورد بررسی و نرسیدن آن ها به نقطه اشباع به عنوان یکی از چالش های استفاده از تصویرهای نوری مانند لندست باشد. نتایج دیگر این تحقیق ارزیابی اثر روش مدل سازی برای افزایش صحت برآورد سنجش از دوری زی توده روی زمینی است. برخلاف نتایج پژوهش‌های قبلی، رگرسیون خطی نتایج بهتری نسبت به روش های ناپارامتری ارائه کرد که دلیل آن می تواند وجود رابطه خطی زی توده روی زمینی و متغیرهای طیفی استخراج شده از تصویرهای لندست باشد. در بین متغیرهای طیفی مختلفی که استفاده شد مقدارهای باند قرمز، مادون قرمز نزدیک و مادون قرمز با طول موج کوتاه 1 و 2 به عنوان متغیر نهایی در اغلب روش های مدل سازی استفاده شدند. نتیجه گیری در این تحقیق، کارایی روش های مختلف مدل سازی را در برآورد زی توده روی زمینی با استفاده از تصویرهای لندست مورد بررسی قرار گرفت.  برآوردهای زی توده با استفاده از 9 روش پارامتری، نیمه پارامتری و ناپارامتری و با استفاده از ارزیابی متقابل fold10  و با 1000 مرتبه تکرار مورد مقایسه قرار گرفتند. نتایج بیانگر قابلیت خوب تصویرهای لندست برای برآورد زی توده روی زمینی جنگل های بلوط زاگرس با هزینه کم است. برآورد زی توده در منطقه جنگلی گهواره با دست خوردگی کمتر صحت بالاتری نسبت به منطقه جنگلی سرفیروزآباد با تخریب بالاتر داشت.
کلیدواژه زی توده روی زمینی، بوت استرپ، مدل سازی آماری، جنگل های زاگرس، لندست
آدرس دانشگاه تربیت مدرس, دانشکده منابع طبیعی و علوم دریایی نور, ایران, دانشگاه تربیت مدرس, دانشکده منابع طبیعی و علوم دریایی نور, گروه جنگلداری, ایران
پست الکترونیکی hsohrabi@modares.ac.ir
 
   Using the bootstrap approach for comparing statistical modeling methods to estimate remotelysensed aboveground biomass in Zagros forests  
   
Authors Safari Amir ,Sohrabi Hormoz
Abstract    Background and ObjectiveConsidering the increasing importance of forest ecosystems in climate change mitigation projects, reliable and costeffective methods are required to estimate the aboveground biomass (AGB). Common  methods used to estimate the aboveground biomass (AGB) include insitu measurement, the biomass calculation using aalometric equations and using remote sensing techniques. Remote sensing has been widely used to estimate the biomass of forests in recent decades.The used statistical modeling method is one of the most important factors to use remotelysensed data for estimation of the aboveground biomass. A large number of researches have been carried out about using the modeling methods. However, these studies face the following different challenges: 1) no modeling method has been recommended as the best method 2) the performence of these modeling methods is affected by forest type, the forest structure, and the present disturbance intensity 3) the performance evaluation and the comparion of the results of these methods were done by using goodnessoffit test and crossvalidation methods. The purpose of this study is to considering the role of choosing statistical modeling methods to estimate remotelysensed aboveground biomass, the current study was conducted to investigate nine statistical modeling methods including linear regression (LR), generalized additive model (GAM), random forest (RF), support vector machine (SVM), boosted regression tree (BRT), knearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS) using bootstrap process and 1000repeated 10fold crossvalidation approach to estimate the aboveground biomass of Zagros forests using Landsat 8 images. Materials and Methods The cuurent study was conducted in Kermanshah forests which is mostly dominated by oak species trees (Quercus spp.) and is located in western Iran on the Zagros Mountains. Zagros forests are generally sparse and open  and comprise approximately 20% of Iran’s area and 40% forest regions of Iran. In order to conduct this study, two forest regions with different levels of human disturbances were chosen; SarfiruzAbad region with highly degraded (HD) forests, and Gahvareh forest region with minor degradation (MD). Geographical coordinates of SarfiruzAbad and Gahvareh regions are 33º57′34º04′N / 47º03′47º17′E & 34º21′ 34º24′N / 46º16′46º23′ E respectively. The Leaf area index (LAI) map derived from the Landsat images based on a global model was used to collect fieldbased sample plots  in both regions of the study. Both regions were divided into three  low, moderate and high  Leaf area index (LAI) strata, and the locations of the sample plots were located by using a systematic inventory at the intersections of a 200m×200 m grid in each stratum. 124 georeferenced square plots of fieldbased sample plots (63 plots in Gahvareh region and 61 plots in SarfiruzAbad region) with 30m×30m dimensions the same size as a Landsat 8 image’s pixel were collected. Allometric equation developed for oak tree in Zagros forests was used to calculate the amount of  the aboveground biomass of each individual tree or sproutclump. The allometric equation used in this study uses  two vertical tree crown diameters to estimate the amount of the biomass of each individual tree or sproutclump. The sum of the amount of the biomass  of each individual tree in sample plot was used to calculate the amount of the biomass plot in sample plot level at a ton per hectare. Our study regions were located in a frame of Landsat 8 images (path/row:167/36). A cloudfree Landsat image relating to 19th Mordad 1394 (10th August 2015) relating to the time when the tree canopies are completely closed and near to the date of land inventory was downloaded from earthexplorer.usgs.gov site. Based on the previous studies, the preprocessing of the used image comprising the radiometric and topographic corrections was done.using C method. To estimate the aboveground biomass in the study areas by using remote sensing, 38 spectral variables including band values, simple band ratios, vegetation indices and common linear transformations like tasseled cap and principle component analysis  were extracted from the used Landsat 8 image. Generally, the efficiency of nine different statistical modeling methods including parametric methods (Linear Regression, LR), semiparametric (Generalized Additive Model, GAM), and nonparametric Random Forest (RF), Support Vector Machine (SVM), Knearest neighbor (KNN), Boosted regression trees (BRT), multivariate additive regression splines, cubist regression (CR), and Gaussian processes regression/model) were compared in order to estimate aboveground biomass. To assess the models, two common quality statistics: (i) determination coefficient and (2) root mean square error via 10 fold cross validation repeated 1000 times approach were calculated. This number of repeats helps to ensure an acceptable assessment of robustness of the results. Results and Discussion The measuredstatistical characteristics of the field sample plots showed that the mean aboveground biomass of SarfiruzAbad and Gahvareh regions were 12.6 ton/ha and 20.5 ton/ha respectively. ANOVA indicated significant differences between modelling methods (treatment effect: p< 0.001) for both R2 and RMSPE calculated in 1000time repeats using 10fold cross validation.The Cubist modeling method with the mean determination coefficient of 0.61 outperformed other methods in SarfiruzAbad region.These resultsfor Gahvareh region showed better efficiency of linear regression (LR), generalized additive model (GAM), and knearest neighbor (KNN) with the mean determination coeffieient of 0.87.The multiple comparisons of different models by using Tukey test concerning RMSE showed that in SarfiruzAbad region, cubist method  with the mean of RMSE 3.3 ton/ha and kNN and RF methods with the mean of RMSE 5.8 ton/ha had a significant difference in comparison to the other methods. Totally, the results of the research revealed the suitable efficiency of Landsat 8 image for AGB estimation in Zagros forests. The acceptable results are due to the low AGB in our study regions that did not reached the saturation point as one of challenges of using optical images like Landsat. The other results of this research is the assessment of the effiecieny of modeling method in order to increase the accuracy of the estimation of remotelysensed aboveground biomass.Unlike the results of the previous studies, linear regression yielded better results compared to nonparametric methods that can be due to the presence of the linear relationship between aboveground biomass and spectral variables derived from Landsat images. Among the used various spectral variables, red, near infrared, and  shortwave infrared 1 and 2  band ratios were selected as the final variable in most modeling methods. Conclusion In this study, we evaluated the effieincy of different statistical modeling methods to estimate AGB in Zagros forests by using Landsat images. The biomass estimations were compared by using nine parametric, semiparametric, and nonparametric methods and using 1000repeated 10fold crossvalidation. The results illustrated the acceptable potentiality of Landsat images for costefficient AGB estimating in Zagros oak forests. The accuracy of AGB estimation in Gahvareh region with lowdegraded forest stands was higher than SarfiruzAbad region with highly degraded stands.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved