|
|
انتخاب ویژگی برخط بر اساس انتگرال فازی چوکت
|
|
|
|
|
نویسنده
|
هاشمی امین ,پژوهان محمدرضا ,دولتشاهی محمدباقر
|
منبع
|
سيستم هاي فازي و كاربردها - 1401 - دوره : 5 - شماره : 1 - صفحه:161 -185
|
چکیده
|
انتخاب ویژگی یک فرایند پیشپردازش دادهها است که برای مجموعهدادههای با ابعاد بالا قبل از اجرای الگوریتمهای یادگیری ماشین و دادهکاوی مورد استفاده قرار میگیرد. هدف از انتخاب ویژگی، پیداکردن یک زیرمجموعهی حداقلی و بهینه از مجموعه ویژگیها است. این زیرمجموعه، ویژگیهای برجسته را شامل میشود در حالی که ویژگیهای غیرمرتبط با برچسب کلاس و تکراری در آن قرار نمیگیرند. برای انجام این کار، بسیاری از روشهای انتخاب ویژگی فعلی به کل ویژگیها در ابتدا نیاز دارند و درصورتیکه ویژگی جدیدی در آینده به مجموعه ویژگیها اضافه شود، الگوریتم باید از ابتدا اجرا شود. بهدستآوردن کل ویژگیها و یا حتی منتظر ماندن برای آن غیرممکن در بسیاری از کاربردهای واقعی ممکن نیست؛ بنابراین برای اینگونه مسائل که کل فضای ویژگی در ابتدا در اختیار ما قرار ندارد، روشهای انتخاب ویژگی برخط ارائه شدهاند. در این مقاله یک روش انتخاب ویژگی برخط با استفاده از مفهوم انتگرال فازی چوکت ارائه شده است. این روش در ابتدا جریانهای ویژگی را بر اساس چندین معیار فیلتر ارزیابی میکند. سپس بر اساس عملگر چوکت نتایج آنها ترکیب و برای حفظ یا نادیدهگرفتن ویژگی تصمیمگیری میشود. در گام ارزیابی، عملکرد الگوریتم پیشنهادی با شش روش انتخاب ویژگی برخط و بر اساس دو دستهبند مقایسه شده است. روش پیشنهادی بر اساس نتایج بهدستآمده در پنج مجموعهداده دنیای واقعی نزدیک دو درصد بهبود نسبت به روشهای مشابه بر اساس معیارهای دقت دستهبندی و امتیازf داشته است. همچنین به دلیل محاسبات ساده در فرایند روش پیشنهادی، ارزیابی ویژگیها در زمان کوتاهی انجام میگیرد.
|
کلیدواژه
|
انتخاب ویژگی برخط، انتگرال فازی چوکت، جریان ویژگی، دادههای با ابعاد بالا
|
آدرس
|
دانشگاه یزد، پردیس فنی و مهندسی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد، پردیس فنی و مهندسی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
dowlatshahi.mb@lu.ac.ir
|
|
|
|
|
|
|
|
|
an online streaming feature selection method based on the choquet fuzzy integral
|
|
|
Authors
|
hashemi amin ,pajoohan mohammad-reza ,dowlatshahi mohammad bagher
|
Abstract
|
feature selection is a data preprocessing technique used for high-dimensional data sets before machine learning and data mining algorithms. the feature selection aims to find a minimal and optimal subset of the feature set. this subset includes valuable features while not including redundant ones. to do this, many current feature selection methods require the entire feature at first, and if a new feature is added to the feature set in the future, the algorithm must be run from the beginning. however, it is impossible to get all the features in many real-world applications or even wait for them. therefore, online feature selection methods are provided for such issues that the entire feature space is not available at first. this paper presents an online feature selection method using the concept of choquet fuzzy integral. this method first evaluates feature flows based on several filter criteria. then, based on the choquet operator, their results are combined, and decisions are made to preserve or ignore the feature. in the evaluation step, the performance of the proposed algorithm is compared with six online feature selection methods based on two categories. the proposed method is based on the results obtained in five real-world datasets that achieve about two percent improvement over similar methods based on classification accuracy and f-score criteria. also, due to the simple calculations in the process of the proposed method, the evaluation of features is done in a short time.
|
|
|
|
|
|
|
|
|
|
|
|
|