>
Fa   |   Ar   |   En
   استفاده از الگوریتم آبکاری فلزات برای بهبود اجماع خوشه ‌بندی  
   
نویسنده رشیدی فروزان ,نجاتیان صمد ,پروین حمید ,رضایی وحیده ,باقری فرد کرم الله
منبع پردازش علائم و داده ها - 1402 - شماره : 1 - صفحه:99 -122
چکیده    خوشه ‌بندی داده‌ها یکی از وظایف اصلی داده ‌کاوی است که وظیفه کاوش الگوهای پنهان در داده‌های بدون برچسب را بر عهده دارد. به خاطر پیچیدگی مسئله و ضعف روش‌های خوشه‌بندی پایه، امروزه اکثر مطالعات به سمت روش‌های اجماع خوشه‌بندی هدایت شده است. اگر چه برای بیشتر مجموعه داده‌ها، الگوریتم‌های خوشه‌بندی منفردی وجود دارد که نتایج قابل قبولی به دست می‌دهند، اما توانایی یک الگوریتم خوشه‌بندی منفرد محدود است. در واقع هدف اصلی اجماع خوشه‌بندی جستجوی نتایج بهتر و پایدارتر، با استفاده از ترکیب اطلاعات و نتایج حاصل از چندین خوشه‌بندی اولیه است. در این مقاله، روشی مبتنی بر اجماع خوشه‌بندی پیشنهاد خواهد شد که مانند بیشتر روش‌های انباشت شواهد دارای دو گام است: 1- ساختن ماتریس مشارکت همزمان و 2- تعیین افراز‌های نهایی از ماتریس مشارکت پیشنهادی. در روش پیشنهادی، برای ساخت ماتریس مشارکت همزمان، علاوه‌بر هم خوشه بودن نمونه‌ها از بعضی اطلاعات دیگر هم استفاده خواهد شد. این اطلاعات می‌توانند مربوط به میزان شباهت نمونه‌ها، اندازه خوشه‌های اولیه، میزان پایداری خوشه‌های اولیه و غیره باشد. در این مقاله مسئله خوشه‌بندی به صورت یک مسئله بهینه‌سازی صریح توسط مدل آمیخته گوسی تعریف می‌شود و که با استفاده از الگوریتم آبکاری فلزات حل می‌شود. همچنین روشی تکاملی مبتنی بر آبکاری فلزات برای تعیین افراز نهایی از ماتریس مشارکت همزمان پیشنهادی ارایه خواهد شد. مهم‌ترین بخش روش تکاملی، تعیین تابع هدفی است که تضمین کند افراز نهایی از کیفیت بالایی برخوردار خواهد بود. نتایج تجربی نشان می دهد روش پیشنهادی از نظر معیارهای مختلف ارزیابی کیفیت خوشه بندی از سایر روش های مشابه بهتر می باشد. 
کلیدواژه اجماع خوشه‌ بندی، مدل آمیخته گوسی، الگوریتم آبکاری فلزات، ماتریس مشارکت همزمان، پایداری، تابع هدف
آدرس دانشگاه آزاد اسلامی واحد یاسوج, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه برق, ایران, دانشگاه آزاد اسلامی واحد نورآباد ممسنی, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه ریاضی, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه کامپیوتر, ایران
پست الکترونیکی k.bagheri@iauyasooj.ac.ir
 
   using simulated annealing algorithm to improve ensemble clustering  
   
Authors rashidi froozan ,nejatian samad ,parvin hamid ,rezaei vahideh ,bagheri fard karamolah
Abstract    data clustering is one of the main tasks of data mining, which is responsible for exploring hidden patterns in unlabeled data. due to the complexity of the problem and the weakness of the basic clustering methods, today most of the studies are directed towards clustering ensemble methods. although for most datasets, there are individual clustering algorithms that provide acceptable results, but the ability of a single clustering algorithm is limited. in fact, the main purpose of clustering ensemble is to search for better and more stable results, using the combination of information and results obtained from several initial clustering. in this paper, a clustering ensemble-based method will be proposed, which, like most evidence accumulation methods, has two steps: 1- building a simultaneous participation matrix and 2- determining the final output from the proposed participation matrix. in the proposed method, some other information will be used in addition to the clustering of the samples to construct the simultaneous participation matrix. this information can be related to the degree of similarity of the samples, the size of the initial clusters, the degree of stability of the initial clusters, etc. in this paper, the clustering problem is defined as an explicit optimization problem by the mixed gaussian model and is solved using the simulated annealing algorithm. also, an evolutionary method based on simulated annealing will be presented to determine the final output from the proposed simultaneous participation matrix. the most important part of the evolutionary method is to determine the objective function that guarantees the final output will be of high quality. the experimental results show that the proposed method is better than other similar methods in terms of different clustering quality evaluation criteria. 
Keywords clustering ensemble ,gaussian mixture model ,simulated annealing algorithm ,simultaneous participation matrix ,stability ,objective function
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved