انتخاب ویژگی چندبرچسبی با استفاده از الگوریتم بهینه ساز جمعیت رقابتی

Fa | Ar | En

انتخاب ویژگی چندبرچسبی با استفاده از الگوریتم بهینه ساز جمعیت رقابتی


نویسنده	بیاتی حمید ,دولتشاهی محمدباقر ,پنیری محسن
منبع	رايانش نرم و فناوري اطلاعات - 1399 - دوره : 9 - شماره : 4 - صفحه:56 -69
چکیده	انتخاب ویژگی یکی از اساسی‌ترین مراحل پیش پردازش داده‌ها در یادگیری ماشین است که با کاهش ابعاد در مجموعه داده‌ها باعث صرفه‌جویی در منابع و افزایش سرعت محاسبات می‌شود. همچنین، انتخاب ویژگی می‌تواند با حذف ویژگی‌های غیرمرتبط و افزونه باعث افزایش دقت و کارایی الگوریتم‌های یادگیری ماشین شود. در این مقاله، یک روش جدید تعبیه‌شده برای انتخاب ویژگی چندبرچسبی پیشنهاد شده است که در آن، مساله انتخاب ویژگی چندبرچسبی برای اولین بار با استفاده از الگوریتم بهینه‌ساز جمعیت رقابتی حل خواهد شد. در روش پیشنهادی، ابتدا جمعیتی از ذرات ساخته می‌شود، سپس ذرات به دو دسته مساوی تقسیم شده و به صورت جفت با هم رقابت می‌کنند، ذرات برنده به تکرار بعد منتقل شده و ذرات بازنده از برنده‌ها یاد می‌گیرند، و در انتهای هر تکرار تابع هدف برای همه ذرات محاسبه می‌شود. این فرایند تا پیدا شدن یک ذره نزدیک به بهینه (که در اینجا ذره‌ای است که کمترین مقدار ضرر را دارد)، ادامه پیدا می‌کند. در این روش برای افزایش سرعت همگرایی، نیمی از جمعیت اولیه با استفاده از یک معیار شباهت ساخته می‌شود و همچنین از یک جستجوگر محلی برای کشف خاصیت محلی داده ها استفاده می‌شود. در انتها، بر اساس بهترین ذره، فرآیند انتخاب ویژگی انجام می‌شود. نتایج پیاده‌سازی روش پیشنهادی و مقایسه آن با نتایج سایر الگوریتم‌های انتخاب ویژگی چند برچسبی نمایانگر کارایی مناسب الگوریتم پشنهادی است.
کلیدواژه	الگوریتم بهینه‌ساز جمعیت رقابتی، انتخاب ویژگی، داده‌های چندبرچسبی، خطای باز تولید، بازنمایی تُنُک
آدرس	دانشگاه لرستان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه مهندسی کامپیوتر, ایران
پست الکترونیکی	mohssen.p10@gmail.com

Multi-label feature selection based on competitive swarm optimization

Authors	Bayati Hamid ,Dowlatshahi Mohammad Bagher ,Paniri Mohsen
Abstract	Feature selection is one of the important preprocessing steps in data mining and machine learning, which is used to dimensionality reduction and selecting a subset of representative features. Feature selection can remove redundant and irrelevant features that can increase the accuracy of the machine learning tasks. In this paper, a novel embedded approach for the multilabel feature selection method using competitive Swarm Optimizer (CSO) is proposed. In this method, at first, of particles is generated, then the particles are divided into two equal groups and compete in pairs, the winners are moved to the next iteration and the losers learn from the winners, and at the end of each iteration, the objective function for all the particles is computed. To increase the convergence rate, half of the initial population is generated by the similarity between features and labels, and a local search method inspired by the gradient descent algorithm is applied to discover the local structure of data. Finally, based on the best particle, the feature selection is done. The performance of the proposed method is compared with six known and stateoftheart multilabel feature selection methods. The experimental results on the image and text multilabel datasets show the efficiency and superiority of the proposed method in different multilabel evaluation measures criteria.
Keywords