مقایسه عملکرد دو روش‌ خوشه‌بندی‌ غیرسلسله‌مراتبی در داده‌های پوشش‌گیاهی

Fa | Ar | En

مقایسه عملکرد دو روش‌ خوشه‌بندی‌ غیرسلسله‌مراتبی در داده‌های پوشش‌گیاهی


نویسنده	پاک گهر نغمه ,اسحاقی راد جواد ,غلامی غلامحسین ,علیجانپور احمد ,رابرتز دیوید دابلیو.
منبع	تحقيقات جنگل و صنوبر ايران - 1400 - دوره : 29 - شماره : 4 - صفحه:315 -325
چکیده	هدف طبقه‌بندی پوشش گیاهی، بهینه‌سازی و خلاصه ‌کردن تغییرات آن به‌عنوان نماینده تغییرات محیطی است که سبب دسترسی به اطلاعات مفید و قابل‌تفسیر از بوم‌سازگان می‌شود. باتوجه‌به وجود تعداد زیادی از روش‌های طبقه‌بندی، انتخاب روش بهینه، چالشی بزرگ است. در پژوهش پیش‌رو، دو روش خوشه‌بندی غیرسلسه‌مراتبی شامل k-means و k-medoids برای بوم‌سازگان‌های جنگلی مقایسه شدند. داده‌های مورد استفاده در این راستا شامل دو مجموعه داده واقعی جمع‌آوری‌شده از نوشهر (جنگل‌های هیرکانی) و اسلام‌‌آباد غرب (جنگل‌های زاگرس) و شش مجموعه داده شبیه‌سازی‌شده بودند. برای آماده‌سازی داده‌ها از تبدیل داده هلینگر استفاده شد. سپس، سه روش اندازه‌گیری فاصله اقلیدسی، بری‌کورتیس و منهتن به‌کار گرفته شدند تا عملکرد دو روش غیرسلسله‌مراتبی مذکور بررسی شود. نتایج طبقه‌بندی به‌دست‌آمده از روش‌های مختلف با سه روش ارزیابی‌کننده سیلوئت، همبستگی فی و isamic مقایسه شدند. نتایج نشان داد که ترکیب ماتریس تشابه بری‌کورتیس و روش‌های خوشه‌بندی k-means و k-medoids به‌ترتیب رتبه‌های اول و دوم را در بین خوشه‌بندی‌های مختلف داشتند. ضعیف‌ترین خوشه‌بندی مربوط به ترکیب ماتریس تشابه منهتن و روش k-medoids بود. روش k-means در داده‌های ناهمگن‌تر مانند داده‌های زاگرس و شبیه‌سازی‌شده، کارایی بیشتری داشت. همچنین، تبدیل داده هلینگر سبب بهبود عملکرد ضریب فاصله اقلیدسی شد. باتوجه‌به نتایج تحلیل‌های مربوطه، ترکیب روش خوشه‌بندی k-means و ماتریس تشابه بری‌کورتیس برای داده‌های جوامع گیاهی پیشنهاد می‌شود.
کلیدواژه	تبدیل داده‌ها، داده شبیه‌سازی‌شده، روش اندازه‌گیری فاصله، کیفیت خوشه‌بندی
آدرس	دانشگاه ارومیه, دانشکده منابع طبیعی, گروه جنگل‌داری, ایران, دانشگاه ارومیه, دانشکده منابع طبیعی, گروه جنگل‌داری, ایران, دانشگاه ارومیه, دانشکده علوم, گروه ریاضی, ایران, دانشگاه ارومیه, دانشکده منابع طبیعی, گروه جنگل‌داری, ایران, دانشگاه ایالتی مونتانا, گروه اکولوژی, آمریکا
پست الکترونیکی	droberts@montana.edu

Comparison of two non-hierarchal clustering performance in vegetation community datasets

Authors	Pakgohar N. ,Eshaghi Rad J. ,gholami Gh. ,Alijanpour A. ,Roberts D.W.
Abstract	Clustering task is optimized and summarized high dimensional vegetation datasets that indicator of environmental change and gathering to interpreting pattern form ecosystem. Variety clustering methods is available and the issue is chosen proper methods. The aim of the research was compared two nonhierarchical clustering as Kmeans and Kmedoids in forest ecosystems. For this purpose, two real datasets from Hyrcanian and Zagros forests of Iran and six simulated datasets were applied. The Hellinger transformation was employed before calculating dissimilarity matrices. Euclidean distance, Manhattan distance and BrayCurtis dissimilarity indices were then calculated on the transformed data sets. And three evaluators including silhouette width, phi coefficient and ISAMIC were chosen. The results show that combination of BrayCurtis dissimilarity matrices and Kmeans and Kmedoids have first and second ranks among other clustering methods. Kmeans clustering is more effective in heterogenous dataset as Zagros and simulated datasets. The weakest clustering algorithm was combination between Manhattan distance and Kmedoids. Also results show that Hellinger data transformation cause to improve Euclidean distance matrix. Our results indicated that combination of BrayCurtis dissimilarity with Kmeans is more significant and recommended.
Keywords