|
|
استفاده از الگوریتم آبکاری فلزات برای بهبود اجماع خوشه بندی
|
|
|
|
|
نویسنده
|
رشیدی فروزان ,نجاتیان صمد ,پروین حمید ,رضایی وحیده ,باقری فرد کرم الله
|
منبع
|
پردازش علائم و داده ها - 1402 - شماره : 1 - صفحه:99 -122
|
چکیده
|
خوشه بندی دادهها یکی از وظایف اصلی داده کاوی است که وظیفه کاوش الگوهای پنهان در دادههای بدون برچسب را بر عهده دارد. به خاطر پیچیدگی مسئله و ضعف روشهای خوشهبندی پایه، امروزه اکثر مطالعات به سمت روشهای اجماع خوشهبندی هدایت شده است. اگر چه برای بیشتر مجموعه دادهها، الگوریتمهای خوشهبندی منفردی وجود دارد که نتایج قابل قبولی به دست میدهند، اما توانایی یک الگوریتم خوشهبندی منفرد محدود است. در واقع هدف اصلی اجماع خوشهبندی جستجوی نتایج بهتر و پایدارتر، با استفاده از ترکیب اطلاعات و نتایج حاصل از چندین خوشهبندی اولیه است. در این مقاله، روشی مبتنی بر اجماع خوشهبندی پیشنهاد خواهد شد که مانند بیشتر روشهای انباشت شواهد دارای دو گام است: 1- ساختن ماتریس مشارکت همزمان و 2- تعیین افرازهای نهایی از ماتریس مشارکت پیشنهادی. در روش پیشنهادی، برای ساخت ماتریس مشارکت همزمان، علاوهبر هم خوشه بودن نمونهها از بعضی اطلاعات دیگر هم استفاده خواهد شد. این اطلاعات میتوانند مربوط به میزان شباهت نمونهها، اندازه خوشههای اولیه، میزان پایداری خوشههای اولیه و غیره باشد. در این مقاله مسئله خوشهبندی به صورت یک مسئله بهینهسازی صریح توسط مدل آمیخته گوسی تعریف میشود و که با استفاده از الگوریتم آبکاری فلزات حل میشود. همچنین روشی تکاملی مبتنی بر آبکاری فلزات برای تعیین افراز نهایی از ماتریس مشارکت همزمان پیشنهادی ارایه خواهد شد. مهمترین بخش روش تکاملی، تعیین تابع هدفی است که تضمین کند افراز نهایی از کیفیت بالایی برخوردار خواهد بود. نتایج تجربی نشان می دهد روش پیشنهادی از نظر معیارهای مختلف ارزیابی کیفیت خوشه بندی از سایر روش های مشابه بهتر می باشد.
|
کلیدواژه
|
اجماع خوشه بندی، مدل آمیخته گوسی، الگوریتم آبکاری فلزات، ماتریس مشارکت همزمان، پایداری، تابع هدف
|
آدرس
|
دانشگاه آزاد اسلامی واحد یاسوج, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه برق, ایران, دانشگاه آزاد اسلامی واحد نورآباد ممسنی, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه ریاضی, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
k.bagheri@iauyasooj.ac.ir
|
|
|
|
|
|
|
|
|
using simulated annealing algorithm to improve ensemble clustering
|
|
|
Authors
|
rashidi froozan ,nejatian samad ,parvin hamid ,rezaei vahideh ,bagheri fard karamolah
|
Abstract
|
data clustering is one of the main tasks of data mining, which is responsible for exploring hidden patterns in unlabeled data. due to the complexity of the problem and the weakness of the basic clustering methods, today most of the studies are directed towards clustering ensemble methods. although for most datasets, there are individual clustering algorithms that provide acceptable results, but the ability of a single clustering algorithm is limited. in fact, the main purpose of clustering ensemble is to search for better and more stable results, using the combination of information and results obtained from several initial clustering. in this paper, a clustering ensemble-based method will be proposed, which, like most evidence accumulation methods, has two steps: 1- building a simultaneous participation matrix and 2- determining the final output from the proposed participation matrix. in the proposed method, some other information will be used in addition to the clustering of the samples to construct the simultaneous participation matrix. this information can be related to the degree of similarity of the samples, the size of the initial clusters, the degree of stability of the initial clusters, etc. in this paper, the clustering problem is defined as an explicit optimization problem by the mixed gaussian model and is solved using the simulated annealing algorithm. also, an evolutionary method based on simulated annealing will be presented to determine the final output from the proposed simultaneous participation matrix. the most important part of the evolutionary method is to determine the objective function that guarantees the final output will be of high quality. the experimental results show that the proposed method is better than other similar methods in terms of different clustering quality evaluation criteria.
|
Keywords
|
clustering ensemble ,gaussian mixture model ,simulated annealing algorithm ,simultaneous participation matrix ,stability ,objective function
|
|
|
|
|
|
|
|
|
|
|