|
|
ارائه یک روش انتخاب ویژگی بر اساس مجموعه های فازی مردد برای یادگیری چندبرچسبی
|
|
|
|
|
نویسنده
|
هاشمی امین ,دولتشاهی محمدباقر
|
منبع
|
سيستم هاي فازي و كاربردها - 1400 - دوره : 4 - شماره : 1 - صفحه:201 -222
|
چکیده
|
امروزه روش های مبتنی بر انتخاب ویژگی با توجه به افزایش داده های حجیم مورد توجه قرار گرفته اند. علاوه بر این با تولید مداوم داده های مختلف و نیز ابعاد بالای این داده ها، روش های موثر در کاهش ابعاد به ویژه انتخاب ویژگی مورد نیاز هستند. بسیاری از داده ها را می توان در گروه داده های چندبرچسبی قرار داد. به این معنا که هر نمونه در مجموعه داده می تواند متعلق به بیش از یک کلاس داده باشد. در این مقاله، یک روش انتخاب ویژگی مبتنی بر مجموعه های فازی مردد برای کاهش ایعاد داده های چندبرچسبی مبتنی بر مفهوم مجموعه های فازی مردد ارائه شده است. در این روش ما از ترکیب سه معیار مختلف در اندازه گیری همبستگی بین ویژگی ها وبرچسب ها و همچنین سه معیار شباهت برای اندازه گیری شباهت بین ویژگی ها استفاده کرده ایم. در واقع هر کدام از این روش ها را به عنوان یک خبره برای تصمیم گیری در انتخاب ویژگی درنظر گرفته ایم. ترکیب روش های همبستگی و شباهت بر اساس مفهوم انرژی اطلاعات در مجموعه های فازی مردد انجام گرفته است. برای اثبات موثر بودن روش پیشنهادی، مقایساتی با روش های جدید در حوزه انتخاب ویژگی چندبرچسبی صورت گرفته است. این مقایسات براساس معیار های دقت، زیان همینگ و زمان اجرای الگوریتم انجام شده اند.
|
کلیدواژه
|
مجموعه های فازی مردد، انتخاب ویژگی، داده های چندبرچسبی، داده های حجیم، انرژی اطلاعات
|
آدرس
|
دانشگاه لرستان, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
dowlatshahi.mb@lu.ac.ir
|
|
|
|
|
|
|
|
|
a feature selection method based on hesitant fuzzy sets for multi-label learning
|
|
|
Authors
|
hashemi amin ,dowlatshahi mohammad
|
Abstract
|
nowadays, feature selection is an essential step in machine learning due to the increase in high-dimensional data. in addition, with the continuous production of various data and the high dimensions of these data, practical methods in reducing the dimensions, mainly feature selection, are needed. many data can be grouped into multi-label data. this means that each instance in a data set can belong to more than one class label. this paper proposes a feature selection method based on hesitant fuzzy sets to reduce the dimensions of multi-label data. in this method, we have used a combination of three different criteria in measuring the correlation between features and labels, as well as three similarity criteria to measure the similarity between features. we have considered these methods as the experts in feature evaluation. correlation and similarity combinations have been performed based on the concept of information energy in hesitant fuzzy sets. to demonstrate the effectiveness of the proposed method, comparisons have been made with new methods in the field of multi-label feature selection. these comparisons are based on the classification accuracy, hemming loss, and execution time of the algorithm.
|
|
|
|
|
|
|
|
|
|
|
|
|