>
Fa   |   Ar   |   En
   خوشه‌بندی ترکیبی با بیشینه‌سازی پراکندگی با به کارگیری الگوریتم‌های بهینه‌سازی تکاملی  
   
نویسنده عباسی صدراله ,نجاتیان صمد ,پروین حمید ,باقری فرد کرم اله ,رضایی وحیده
منبع پردازش علائم و داده ها - 1401 - شماره : 4 - صفحه:95 -120
چکیده    خوشه‌بندی داده‌ها یکی از مراحل اصلی در داده‌کاوی است که وظیفه کاوش الگوهای پنهان در داده‌های بدون برچسب را بر عهده دارد. به خاطر پیچیدگی مسئله و ضعف روش‌های خوشه‌بندی پایه، امروزه اکثر مطالعات به سمت روش‌های خوشه‌بندی ترکیبی هدایت شده است. پراکندگی در نتایج اولیه یکی از مهم‌ترین عواملی است که می‌تواند در کیفیت نتایج نهایی اثرگذار باشد. همچنین، کیفیت نتایج اولیه نیز عامل دیگری است که در کیفیت نتایج حاصل از ترکیب موثر است. هر دو عامل در تحقیقات اخیر خوشه‌بندی ترکیبی مورد توجه قرار گرفته‌اند. در این جا یک چارچوب جدید برای بهبود کارایی خوشه‌بندی ترکیبی پیشنهاد شده است که مبتنی بر استفاده از زیرمجموعه‌ای از خوشه‌های اولیه می‌باشند روش ارائه شده نشان می دهد که  استفاده از زیرمجموعه‌ای از نتایج خوشه‌بندی‌های اولیه می‌تواند بهتر از استفاده از کل نتایج باشد همچنین معیاری را پشنهاد می دهد  که چگونه  نتایج اولیه نسبت به هم ارزیابی شوند. این تحقیق معیاری ارایه می دهد که به وسیله آن میتوان تشخیص داد کدام زیرمجموعه از نتایج اولیه می‌تواند منجر به بهبود عملکرد خوشه‌بندی ترکیبی شود.  از آن جایی که الگوریتم های هوشمند تکاملی توانسته اند اکثریت مسائل پیچیده مهندسی را حل نمایند، در این مقاله نیز از این روش های هوشمند برای انتخاب زیرمجموعه ای از خوشه های اولیه استفاده شده است.  این انتخاب به کمک سه روش هوشمند (الگوریتم ژنتیک، شبیه سازی تبرید و الگوریتم ازدحام ذرات) انجام می گیرد. ایده‌های اصلی در روش‌های پیشنهادی برای انتخاب زیرمجموعه‌ای از خوشه‌ها، استفاده از خوشه‌های پایدار به کمک الگوریتم های جستجوی هوشمند (الگوریتم های تکاملی) می‌باشند. برای ارزیابی خوشه‌ها، از معیار پایداری مبتنی بر اطلاعات متقابل استفاده شده است. در آخر نیز خوشه های انتخاب شده را به کمک چندین روش ترکیب نهایی با هم جمع می کنیم. نتایج تجربی روی چندین مجموعه داده استاندارد و با معیارهای ارزیابی اطلاعات متقابل نرمال شده، فیشر و دقت در مقایسه با روش های علیزاده، عظیمی، berikov ، clwgc، rcescc، kme، cfsfdp،dbscab، nsc و chenنشان می‌دهد که روش های‌ پیشنهادی می‌تواند به طور موثری روش ترکیب کامل  را بهبود دهد.  
کلیدواژه بهینه سازی محلی، پراکندگی، الگوریتم های تکاملی، ماتریس همبستگی،  پراکندگی
آدرس دانشگاه آزاد اسلامی واحد یاسوج, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه برق, ایران, دانشگاه آزاد اسلامی واحد نورآباد ممسنی, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد یاسوج, گروه ریاضی, ایران
پست الکترونیکی vahidehrezaie@gmail.com
 
   the ensemble clustering with maximize diversity using evolutionary optimization algorithms  
   
Authors abbasi sadrollah ,nejatian samad ,parvin hamid ,bagheri fard karamollah ,rezaei vahideh
Abstract    data clustering is one of the main steps in data mining, which is responsible for exploring hidden patterns in non-tagged data. due to the complexity of the problem and the weakness of the basic clustering methods, most studies today are guided by clustering ensemble methods. diversity in primary results is one of the most important factors that can affect the quality of the final results. also, the quality of the initial results is another factor that affects the quality of the results of the ensemble. both factors have been considered in recent research on ensemble clustering. here, a new framework for improving the efficiency of clustering has been proposed, which is based on the use of a subset of primary clusters, and the proposed method answers the above questions and ambiguities. the selection of this subset plays a vital role in the efficiency of the assembly. since evolutionary intelligent algorithms have been able to solve the majority of complex engineering problems, this paper also uses these intelligent methods to select subsets of primary clusters. this selection is done using three intelligent methods (genetic algorithm, simulation annealing and particle swarm optimization). in this paper a clustering ensemble method is proposed which is based on a subset of primary clusters. the main idea behind this method is using more stable clusters in the ensemble. the stability is applied as a goodness measure of the clusters. the clusters which satisfy a threshold of this measure are selected to participate in the ensemble. for combining the chosen clusters, a co-association based consensus function is applied. a new eac based method which is called extended evidence accumulation clustering, eeac, is proposed for constructing the co-association matrix from the subset of clusters. experimental results on several standard datasets with normalized mutual information evaluation, fisher and accuracy criteria compared to alizadeh, azimi, berikov, clwgc, rcescc, kme, cfsfdp, dbscab, nsc and chen methods show the significant improvement of the proposed method in comparison with other ones. keywords: clustering ensemble, local optimization, evolutionary algorithm, correlation matrix, diversity.
Keywords clustering ensemble ,local optimization ,evolutionary algorithm ,correlation matrix ,diversity.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved