|
|
یک الگوریتم انتخاب ویژگی برخط در جریان دادهها با استفاده از اطلاعات متقابل چندمتغیره
|
|
|
|
|
نویسنده
|
رحمانی نیا مریم ,مرادی پرهام
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1399 - دوره : 18 - شماره : 4 - صفحه:327 -336
|
چکیده
|
امروزه در بسیاری از مسایل دنیای واقعی همچون شبکههای اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه دادههای موجود اضافه میشود. از آنجا که کارایی بیشتر الگوریتمهای دادهکاوی با افزایش ابعاد دادهها کاهش مییابد، تحلیل این جریان دادهها در سالهای اخیر به یکی از مسایل مهم در دادهکاوی تبدیل شده است. روشهای انتخاب ویژگی در جریان دادههای برخط، روشهای کارآمدی هستند که با حذف ویژگیهای افزونه و نامربوط باعث کاهش ابعاد کلان دادهها و در نتیجه بهبود کارایی الگوریتمها میشوند. از چالشهای اساسی در رابطه با الگوریتمهای انتخاب ویژگی برخط، در دسترس نبودن همه دادهها قبل از شروع الگوریتم، مقیاسپذیری، دقت ویژگیهای انتخابشده و اندازه زیرمجموعه انتخابی را میتوان نام برد. تا کنون الگوریتمهای انتخاب ویژگی موجود تنها توانستهاند بخش محدودی از این چالشها را به صورت همزمان مرتفع کنند. به همین منظور در این مقاله یک راهکار انتخاب ویژگی برخط به نام mmiosfs با استفاده از اطلاعات متقابل ارائه دادهایم که حد واسط بهتری را میان چالشهای ذکرشده به دست میآورد. در روش پیشنهادی در ابتدا مجموعه ویژگیها با استفاده از تکنیک متغیرهای تصادفی توام به یک ویژگی نگاشت و سپس اطلاعات متقابل ویژگی جدید با برچسب به عنوان میزان ارتباط مجموعه ویژگیهای اولیه در نظر گرفته میشود. کارایی روش پیشنهادی با چند الگوریتم انتخاب ویژگی برخط با استفاده از دستهبندهای مختلف مورد ارزیابی قرار گرفته و نتایج به دست آمده نشان میدهد الگوریتم پیشنهادی معمولاً حد واسط بهتری میان چالشها به دست میآورد.
|
کلیدواژه
|
انتخاب ویژگی، دادههای آموزشی برخط، اطلاعات متقابل، متغیر تصادفی مشترک
|
آدرس
|
دانشگاه آزاد اسلامی واحد قصرشیرین, گروه مهندسی کامپیوتر, ایران, دانشگاه کردستان, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
pmoradi@gmail.com
|
|
|
|
|
|
|
|
|
A Feature Selection Algorithm in Online Stream Dataset Based on Multivariate Mutual Information
|
|
|
Authors
|
Rahmaninia Maryam ,Moradi Parham
|
Abstract
|
Today, in many realworld applications, such as social networks, we are faced with data streams which new data is appeared every moment. Since the efficiency of most data mining algorithms decreases with increasing data dimensions, analysis of the data has become one of the most important issues recently. Online stream feature selection is an effective approach which aims at removing those of redundant features and keeping relevant ones, leads to reduce the size of the data and improve the accuracy of the online data mining methods. There are several critical issues for online stream feature selection methods including: unavailability of the entire feature set before starting the algorithm, scalability, stability, classification accuracy, and size of selected feature set. So far, existing methods have only been able to address a few numbers of these issues simultaneously. To this end, in this paper, we present an online feature selection method called MMIOSFS that provides a better tradeoff between these challenges using Mutual Information. In the proposed method, first the feature set is mapped to a new feature using joint Random variables technique, then the mutual information of new feature with the class label is computed as the degree of relationship between the features set. The efficiency of the proposed method was compared to several online feature selection algorithms based on different categories. The results show that the proposed method usually achieves better tradeoff between the mentioned challenges.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|