|
|
مقایسه عملکرد دو روش خوشهبندی غیرسلسلهمراتبی در دادههای پوششگیاهی
|
|
|
|
|
نویسنده
|
پاک گهر نغمه ,اسحاقی راد جواد ,غلامی غلامحسین ,علیجانپور احمد ,رابرتز دیوید دابلیو.
|
منبع
|
تحقيقات جنگل و صنوبر ايران - 1400 - دوره : 29 - شماره : 4 - صفحه:315 -325
|
چکیده
|
هدف طبقهبندی پوشش گیاهی، بهینهسازی و خلاصه کردن تغییرات آن بهعنوان نماینده تغییرات محیطی است که سبب دسترسی به اطلاعات مفید و قابلتفسیر از بومسازگان میشود. باتوجهبه وجود تعداد زیادی از روشهای طبقهبندی، انتخاب روش بهینه، چالشی بزرگ است. در پژوهش پیشرو، دو روش خوشهبندی غیرسلسهمراتبی شامل k-means و k-medoids برای بومسازگانهای جنگلی مقایسه شدند. دادههای مورد استفاده در این راستا شامل دو مجموعه داده واقعی جمعآوریشده از نوشهر (جنگلهای هیرکانی) و اسلامآباد غرب (جنگلهای زاگرس) و شش مجموعه داده شبیهسازیشده بودند. برای آمادهسازی دادهها از تبدیل داده هلینگر استفاده شد. سپس، سه روش اندازهگیری فاصله اقلیدسی، بریکورتیس و منهتن بهکار گرفته شدند تا عملکرد دو روش غیرسلسلهمراتبی مذکور بررسی شود. نتایج طبقهبندی بهدستآمده از روشهای مختلف با سه روش ارزیابیکننده سیلوئت، همبستگی فی و isamic مقایسه شدند. نتایج نشان داد که ترکیب ماتریس تشابه بریکورتیس و روشهای خوشهبندی k-means و k-medoids بهترتیب رتبههای اول و دوم را در بین خوشهبندیهای مختلف داشتند. ضعیفترین خوشهبندی مربوط به ترکیب ماتریس تشابه منهتن و روش k-medoids بود. روش k-means در دادههای ناهمگنتر مانند دادههای زاگرس و شبیهسازیشده، کارایی بیشتری داشت. همچنین، تبدیل داده هلینگر سبب بهبود عملکرد ضریب فاصله اقلیدسی شد. باتوجهبه نتایج تحلیلهای مربوطه، ترکیب روش خوشهبندی k-means و ماتریس تشابه بریکورتیس برای دادههای جوامع گیاهی پیشنهاد میشود.
|
کلیدواژه
|
تبدیل دادهها، داده شبیهسازیشده، روش اندازهگیری فاصله، کیفیت خوشهبندی
|
آدرس
|
دانشگاه ارومیه, دانشکده منابع طبیعی, گروه جنگلداری, ایران, دانشگاه ارومیه, دانشکده منابع طبیعی, گروه جنگلداری, ایران, دانشگاه ارومیه, دانشکده علوم, گروه ریاضی, ایران, دانشگاه ارومیه, دانشکده منابع طبیعی, گروه جنگلداری, ایران, دانشگاه ایالتی مونتانا, گروه اکولوژی, آمریکا
|
پست الکترونیکی
|
droberts@montana.edu
|
|
|
|
|
|
|
|
|
Comparison of two non-hierarchal clustering performance in vegetation community datasets
|
|
|
Authors
|
Pakgohar N. ,Eshaghi Rad J. ,gholami Gh. ,Alijanpour A. ,Roberts D.W.
|
Abstract
|
Clustering task is optimized and summarized high dimensional vegetation datasets that indicator of environmental change and gathering to interpreting pattern form ecosystem. Variety clustering methods is available and the issue is chosen proper methods. The aim of the research was compared two nonhierarchical clustering as Kmeans and Kmedoids in forest ecosystems. For this purpose, two real datasets from Hyrcanian and Zagros forests of Iran and six simulated datasets were applied. The Hellinger transformation was employed before calculating dissimilarity matrices. Euclidean distance, Manhattan distance and BrayCurtis dissimilarity indices were then calculated on the transformed data sets. And three evaluators including silhouette width, phi coefficient and ISAMIC were chosen. The results show that combination of BrayCurtis dissimilarity matrices and Kmeans and Kmedoids have first and second ranks among other clustering methods. Kmeans clustering is more effective in heterogenous dataset as Zagros and simulated datasets. The weakest clustering algorithm was combination between Manhattan distance and Kmedoids. Also results show that Hellinger data transformation cause to improve Euclidean distance matrix. Our results indicated that combination of BrayCurtis dissimilarity with Kmeans is more significant and recommended.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|