|
|
انتخاب ویژگی چندبرچسبی با استفاده از الگوریتم بهینه ساز جمعیت رقابتی
|
|
|
|
|
نویسنده
|
بیاتی حمید ,دولتشاهی محمدباقر ,پنیری محسن
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1399 - دوره : 9 - شماره : 4 - صفحه:56 -69
|
|
|
چکیده
|
انتخاب ویژگی یکی از اساسیترین مراحل پیش پردازش دادهها در یادگیری ماشین است که با کاهش ابعاد در مجموعه دادهها باعث صرفهجویی در منابع و افزایش سرعت محاسبات میشود. همچنین، انتخاب ویژگی میتواند با حذف ویژگیهای غیرمرتبط و افزونه باعث افزایش دقت و کارایی الگوریتمهای یادگیری ماشین شود. در این مقاله، یک روش جدید تعبیهشده برای انتخاب ویژگی چندبرچسبی پیشنهاد شده است که در آن، مساله انتخاب ویژگی چندبرچسبی برای اولین بار با استفاده از الگوریتم بهینهساز جمعیت رقابتی حل خواهد شد. در روش پیشنهادی، ابتدا جمعیتی از ذرات ساخته میشود، سپس ذرات به دو دسته مساوی تقسیم شده و به صورت جفت با هم رقابت میکنند، ذرات برنده به تکرار بعد منتقل شده و ذرات بازنده از برندهها یاد میگیرند، و در انتهای هر تکرار تابع هدف برای همه ذرات محاسبه میشود. این فرایند تا پیدا شدن یک ذره نزدیک به بهینه (که در اینجا ذرهای است که کمترین مقدار ضرر را دارد)، ادامه پیدا میکند. در این روش برای افزایش سرعت همگرایی، نیمی از جمعیت اولیه با استفاده از یک معیار شباهت ساخته میشود و همچنین از یک جستجوگر محلی برای کشف خاصیت محلی داده ها استفاده میشود. در انتها، بر اساس بهترین ذره، فرآیند انتخاب ویژگی انجام میشود. نتایج پیادهسازی روش پیشنهادی و مقایسه آن با نتایج سایر الگوریتمهای انتخاب ویژگی چند برچسبی نمایانگر کارایی مناسب الگوریتم پشنهادی است.
|
کلیدواژه
|
الگوریتم بهینهساز جمعیت رقابتی، انتخاب ویژگی، دادههای چندبرچسبی، خطای باز تولید، بازنمایی تُنُک
|
آدرس
|
دانشگاه لرستان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
mohssen.p10@gmail.com
|
|
|
|
|
|
|
|
|
Multi-label feature selection based on competitive swarm optimization
|
|
|
Authors
|
Bayati Hamid ,Dowlatshahi Mohammad Bagher ,Paniri Mohsen
|
Abstract
|
Feature selection is one of the important preprocessing steps in data mining and machine learning, which is used to dimensionality reduction and selecting a subset of representative features. Feature selection can remove redundant and irrelevant features that can increase the accuracy of the machine learning tasks. In this paper, a novel embedded approach for the multilabel feature selection method using competitive Swarm Optimizer (CSO) is proposed. In this method, at first, of particles is generated, then the particles are divided into two equal groups and compete in pairs, the winners are moved to the next iteration and the losers learn from the winners, and at the end of each iteration, the objective function for all the particles is computed. To increase the convergence rate, half of the initial population is generated by the similarity between features and labels, and a local search method inspired by the gradient descent algorithm is applied to discover the local structure of data. Finally, based on the best particle, the feature selection is done. The performance of the proposed method is compared with six known and stateoftheart multilabel feature selection methods. The experimental results on the image and text multilabel datasets show the efficiency and superiority of the proposed method in different multilabel evaluation measures criteria.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|