|
|
مقایسه روش های شناسایی داده های پرت و تاثیر آنها در مطالعات اندازه گیری و ارزیابی مراتع
|
|
|
|
|
نویسنده
|
رستم پور مسلم
|
منبع
|
مرتع و آبخيزداري - 1401 - دوره : 75 - شماره : 4 - صفحه:639 -660
|
چکیده
|
این تحقیق به مقایسه روشهای شناسایی داده پرت تک متغیره در بین دادههای درصد پوشش گیاهی در یک مطالعه ارزیابی تاثیر شدت چرا در مراتع مناطق خشک میپردازد. بدین منظور، پس از اندازهگیری درصد پوشش گیاهی در مرتع و قبل از تحلیل آماری، وجود یا عدم وجود داده پرت به عنوان پیش فرض آزمونهای پارامتریک فرضیه مقایسهای بررسی شد. در این تحقیق از هشت روش شامل نمودار جعبهای (boxplot) و دامنه میان چارکی (روش tukey)، انحراف معیار از میانگین (قانون three-sigma)، انحراف مطلق از میانه (روش hampel)، میانگین پیراسته، مقادیر صدک 1 و 99، آزمون کای اسکوئر (χ²)، آزمون گرابز (esd) و آزمون روزنر (generalised esd) استفاده شد. نتایج نشان داد که دادههای درصد پوشش گیاهی مراتع با شدت چرای سبک و متوسط توزیع نرمال ندارند (آزمون شاپیرو-ویلک:p≥0.05. حتی حذف داده پرت نیز منجر به نرمال شدن دادهها نشد، اما منجر به همگن شدن واریانس خطا شد (آزمون لیون: p≤0.05. از هشت روش مورد استفاده، روش z اصلاح شده و آزمونهای گرابز و روزنر p≥0.05، هیچکدام از دادههای درصد پوشش گیاهی را به عنوان داده پرت تشخیص ندادند. از بین روشهای مورد مطالعه، نمودار جعبهای و روش انحراف مطلق از میانه که به میانگین وابسته نیستند، برای دادههای پوشش گیاهی مناسبترند. از اینرو قبل از انجام هرگونه آزمون فرضیه مقایسهای، استفاده ترکیبی از دو روش چشمی و آماری برای بررسی وجود یا عدم وجود دادههای پرت توصیه میشود.
|
کلیدواژه
|
آمار پارامتری، پوشش گیاهی، داده دورافتاده، میانگین، مرتع
|
آدرس
|
دانشگاه بیرجند, دانشکده منابع طبیعی و محیط زیست, گروه مرتع و آبخیزداری، گروه پژوهشی خشکسالی و تغییر اقلیم, ایران
|
پست الکترونیکی
|
rostampour@birjand.ac.ir
|
|
|
|
|
|
|
|
|
comparison of outlier detection methods and their impact on rangeland measurement and assessment studies
|
|
|
Authors
|
rostampour moselm
|
Abstract
|
this study compared of univariate outlier detection methods among vegetation data in a study of the effect of grazing intensity in the rangelands of arid regions. for this purpose, after measuring the vegetation cover in the rangeland and before the statistical analysis, the presence of outlier data was examined as the assumption of parametric comparison tests. in this study, eight methods including the boxplot and iqr (tukey method), standard deviation of the mean (three-sigma rule), median absolute deviation (hampel method), trimmed mean, 1st percentile and 99th percentile, the chi square test (χ²), the grubbs test (esd) and the rosner test (generalized esd) were used. the results showed that the vegetation cover of rangelands with light and moderate grazing intensity was not normally distributed (shapiro-wilk test: p≤0.05). even deletion of outliers did not lead to a normal distribution, but it resulted in the homogeneity of variances (levene’s test: p≥0.05). the modified z-score and the grubbs and rosner tests (p≥0.05) did not identify outliers from the vegetation cover data. among the methods evaluated, the boxplot and mad method, which are not dependent on the mean, are more suitable for the vegetation cover. therefore, before performing any comparison test, a combination of visual and statistical methods is recommended to evaluate the presence of outliers.
|
Keywords
|
mean ,outliers ,parametric statistics ,rangeland ,vegetation
|
|
|
|
|
|
|
|
|
|
|