|
|
استخراج ویژگی مبتنی بر تفکیک پذیری بیشتر طبقه ها با استفاده از طبقه بندهای کمکی
|
|
|
|
|
نویسنده
|
غفاری حمیدرضا ,جلالی مجاهد آتنا
|
منبع
|
پردازش علائم و داده ها - 1400 - شماره : 2 - صفحه:29 -44
|
چکیده
|
طبقه بندی یک روش یادگیری ماشین است که برای پیش گویی برچسب یک نمونه خاص با کمترین خطا استفاده می شود. در این مقاله، از توانایی پیش گویی برچسب به کمک طبقه بند برای ایجاد ویژگی جدید استفاده شده است. امروزه روش های استخراج ویژگی زیادی مانند pca و ica وجود دارند که در زمینه های مختلف بطور وسیع استفاده می شوند و از هزینه بالای انتقال به فضای دیگر رنج می برند. در روش پیشنهادی، هدف این است که به کمک ویژگی جدید، قدرت تفکیک پذیری بیشتری بین کلاس های مختلف ایجاد شود و دادههای درون کلاس ها به یکدیگر نزدیک تر و تمایز بیشتری بین دادههای کلاس های مختلف بوجود آید تا کارایی طبقه بندها افزایش یابد. ابتدا به کمک یک یا چند طبقه بند، برچسب پیشنهادی برای مجموعه داده اولیه تعیین و بعنوان ویژگی جدید به مجموعه داده اولیه اضافه می شود. ایجاد مدل به کمک مجموعه داده جدید انجام می شود. ویژگی جدید برای مجموعه داده آموزش و تست بصورت جداگانه بدست آورده می شود. آزمایش ها بر روی 20 مجموعه داده استاندارد انجام شده و نتایج روش پیشنهادی با نتایج دو روش بیان شده در کارهای مرتبط نیز مقایسه شده است. نتایج حاصل نشان می دهد که روش پیشنهادی به طورقابل توجهی باعث بهبود دقت طبقه بندی شده است. در بخش دوم آزمایشات، برای بررسی میزان موثر بودن روش پیشنهادی، قدرت تفکیک پذیری ویژگی جدید بر اساس دو معیار بهره اطلاعاتی و شاخص جینی بررسی شده است. نتایج نشان می دهد که ویژگی به دست آمده در روش پیشنهادی در بیشتر موارد دارای بهره اطلاعاتی بیشتر و شاخص جینی کمتری است، زیرا بی نظمی کمتری دارد. در ادامه، جهت جلوگیری از افزایش ابعاد داده، ویژگی استخراج شده با بیشترین بار اطلاعاتی، جایگزین ویژگی با کمترین بار اطلاعاتی شده است. نتایج این مرحله نیز بیانگر افزایش میزان کارایی می باشد.
|
کلیدواژه
|
استخراج ویژگی، طبقه بندی، بهره اطلاعاتی، شاخص جینی.
|
آدرس
|
دانشگاه آزاد اسلامی واحد فردوس, گروه رایانه, ایران, دانشگاه آزاد اسلامی واحد فردوس, گروه رایانه, ایران
|
پست الکترونیکی
|
st.ajalalia@ferdowsiau.ac.ir
|
|
|
|
|
|
|
|
|
Feature extraction based on the more resolution of the classes using auxiliary classifiers
|
|
|
Authors
|
Ghaffari Hamid Reza ,Jalali Mojahed Atena
|
Abstract
|
Classification is a machine learning method used to predict a particular sample rsquo;s label with the least error. The present study was conducted using label prediction ability with the help of a classifier to create a new feature. Today, there are several featureextraction methods like principal component analysis (PCA) and independent component analysis (ICA) that are widely used in different fields; however, they all suffer from the high cost of transferring to another space. The purpose of the proposed method was to create a higher distinction between various classes using the new feature such that to make the data in the classes closer to each other. As a result, more differentiation is created between the data of various classes to increase the efficiency of classifiers. Firstly, the suggested labels for the primary data set were determined using one or more classifiers and added to the primary data set as a new feature. The model was created using a new data set. The new feature for training and testing data sets was provided separately. The tests were performed on 20 standard data sets and the results of the proposed method were compared with those of the two methods described in the related studies. The outputs indicated that the proposed method has significantly improved the classification accuracy. In the second part of the tests, the resolution of the new feature was examined according to two criteria, namely Information Gain and Gini Index, to examine the effectiveness of the proposed method. The results showed that the feature obtained in the proposed method has higher Information Gain and lower Gini Index in most cases, as it has less irregularity. To prevent the increase in data dimensions, the feature with the least Information Gain was replaced with the feature extracted with the most Information Gain. The results of this step showed an increase in efficiency as well.
|
Keywords
|
Feature extraction ,classification ,information gain ,Gini index.
|
|
|
|
|
|
|
|
|
|
|