>
Fa   |   Ar   |   En
   انتخاب ویژگی برخط بر اساس انتگرال فازی چوکت  
   
نویسنده هاشمی امین ,پژوهان محمدرضا ,دولتشاهی محمدباقر
منبع سيستم هاي فازي و كاربردها - 1401 - دوره : 5 - شماره : 1 - صفحه:161 -185
چکیده    انتخاب ویژگی یک فرایند پیش‌پردازش داده‌ها است که برای مجموعه‌داده‌های با ابعاد بالا قبل از اجرای الگوریتم‌های یادگیری ماشین و داده‌کاوی مورد استفاده قرار می‌گیرد. هدف از انتخاب ویژگی، پیداکردن یک زیرمجموعه‌ی حداقلی و بهینه از مجموعه ویژگی‌ها است. این زیرمجموعه، ویژگی‌های برجسته را شامل می‌شود در حالی که ویژگی‌های غیر‌مرتبط با برچسب کلاس و تکراری در آن قرار نمی‌گیرند. برای انجام این کار، بسیاری از روش‌های انتخاب ویژگی فعلی به کل ویژگی‌ها در ابتدا نیاز دارند و درصورتی‌که ویژگی جدیدی در آینده به مجموعه ویژگی‌ها اضافه شود، الگوریتم باید از ابتدا اجرا شود. به‌دست‌آوردن کل ویژگی‌ها و یا حتی منتظر ماندن برای آن غیر‌ممکن در بسیاری از کاربردهای واقعی ممکن نیست؛ بنابراین برای این‌گونه مسائل که کل فضای ویژگی در ابتدا در اختیار ما قرار ندارد، روش‌های انتخاب ویژگی برخط ارائه شده‌اند. در این مقاله یک روش انتخاب ویژگی برخط با استفاده از مفهوم انتگرال فازی چوکت ارائه شده است. این روش در ابتدا جریان‌های ویژگی را بر اساس چندین معیار فیلتر ارزیابی می‌کند. سپس بر اساس عملگر چوکت نتایج آن‌ها ترکیب و برای حفظ یا نادیده‌گرفتن ویژگی تصمیم‌گیری می‌شود. در گام ارزیابی، عملکرد الگوریتم پیشنهادی با شش روش انتخاب ویژگی برخط و بر اساس دو دسته‌بند مقایسه شده است. روش پیشنهادی بر اساس نتایج به‌دست‌آمده در پنج مجموعه‌داده دنیای واقعی نزدیک دو درصد بهبود نسبت به روش‌های مشابه بر اساس معیارهای دقت دسته‌بندی و امتیازf داشته است. همچنین به دلیل محاسبات ساده در فرایند روش پیشنهادی، ارزیابی ویژگی‌ها در زمان کوتاهی انجام می‌گیرد.
کلیدواژه انتخاب ویژگی برخط، انتگرال فازی چوکت، جریان ویژگی، داده‌های با ابعاد بالا
آدرس دانشگاه یزد، پردیس فنی و مهندسی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد، پردیس فنی و مهندسی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه لرستان, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران
پست الکترونیکی dowlatshahi.mb@lu.ac.ir
 
   an online streaming feature selection method based on the choquet fuzzy integral  
   
Authors hashemi amin ,pajoohan mohammad-reza ,dowlatshahi mohammad bagher
Abstract    feature selection is a data preprocessing technique used for high-dimensional data sets before machine learning and data mining algorithms. the feature selection aims to find a minimal and optimal subset of the feature set. this subset includes valuable features while not including redundant ones. to do this, many current feature selection methods require the entire feature at first, and if a new feature is added to the feature set in the future, the algorithm must be run from the beginning. however, it is impossible to get all the features in many real-world applications or even wait for them. therefore, online feature selection methods are provided for such issues that the entire feature space is not available at first. this paper presents an online feature selection method using the concept of choquet fuzzy integral. this method first evaluates feature flows based on several filter criteria. then, based on the choquet operator, their results are combined, and decisions are made to preserve or ignore the feature. in the evaluation step, the performance of the proposed algorithm is compared with six online feature selection methods based on two categories. the proposed method is based on the results obtained in five real-world datasets that achieve about two percent improvement over similar methods based on classification accuracy and f-score criteria. also, due to the simple calculations in the process of the proposed method, the evaluation of features is done in a short time.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved