|
|
معرفی یک روش انتخاب ویژگی چند-برچسبه مبتنی بر کمینه کردن افزونگی
|
|
|
|
|
نویسنده
|
حسنیه حکیمه ,ابراهیمی بهزاد ,صابری موحد فرید ,افتخاری مهدی
|
منبع
|
پژوهشهاي نظري و كاربردي هوش ماشيني - 1402 - دوره : 1 - شماره : 2 - صفحه:16 -28
|
چکیده
|
روشهای انتخاب ویژگی ابزاری کارا در بهبود فرآیند یادگیری شناخته میشوند. هدف از یک روش انتخاب ویژگی، شناسایی ویژگیهای مرتبط و حذف ویژگیهای غیرمرتبط به منظور بدست آوردن یک زیرمجموعه مناسب از ویژگیها است، بطوریکه افزونگی بین ویژگیهای انتخاب شده کمینه گردد. در دادههای چند-برچسبه، این امکان وجود دارد که در صورت وجود همبستگی بین ویژگیها، مقدار افزونگی در مجموعه ویژگیها افزایش یابد. وجود افزونگی بین ویژگیها به همراه چالش ابعاد بالای دادههای چند-برچسبه، میتواند باعث افزایش حجم محاسبات، کاهش دقت و در نهایت افزایش احتمال رخ دادن خطا در پیشبینی و طبقهبندی دادههای چند-برچسبه شود. در این مقاله، با هدف کمینهکردن افزونگی ویژگیهای انتخابی، یک الگوریتم انتخاب ویژگی چند-برچسبه با در نظر گرفتن مدل رگرسیون کمترین مربعات خطا و تنظیم تنکی پیشنهاد شده است. در انتها، با استفاده از تعدادی مجموعه داده چند-برچسبه مشهور، کارایی روش پیشنهادی بررسی میگردد و نتایج بدست آمده با چند روش انتخاب ویژگی چند-برچسبه متداول مقایسه میشود
|
کلیدواژه
|
انتخاب ویژگی چند-برچسبه، کمینه کردن افزونگی، رگرسیون، کمترین مربعات خطا، تنظیم تنکی
|
آدرس
|
دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته, دانشکده علوم و فناوریهای نوین, گروه ریاضی کاربردی, ایران, دانشگاه شهید باهنر کرمان, بخش مهندسی کامپیوتر, ایران, دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته, دانشکده علوم و فناوریهای نوین, گروه ریاضی کاربردی, ایران, دانشگاه شهید باهنر کرمان, بخش مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
m.eftekhari@uk.ac.ir
|
|
|
|
|
|
|
|
|
multi-label feature selection method based on redundancy minimization
|
|
|
Authors
|
hasaniyeh hakimeh ,ebrahimi behzad ,saberi-movahed farid ,eftekhari mahdi
|
Abstract
|
feature selection methods are known to be effective in improving the learning process. the purpose of a feature selection method is to identify relevant features and remove irrelevant features in order to obtain a suitable subset of features, so that the redundancy between the selected features is minimized. in multi-label data, if there is a correlation between features, it is possible that the amount of redundancy in the feature set is increased. the existence of redundancy between features along with the challenge of high dimensions of multi-label data can grow the computational calculations, decrease the accuracy and finally increase the probability of errors in the prediction and classification of multi-label data. in this article, with the aim of minimizing the redundancy of features, a multi-label feature selection algorithm is proposed considering the least squares regression model and sparse regularization. finally, using a number of well-known multi-label data sets, the efficiency of the proposed method is verified and the results are compared with some common multi-label feature selection methods.
|
Keywords
|
multi-label feature selection ,redundancy minimization ,regression ,least squared error ,sparsity regularization
|
|
|
|
|
|
|
|
|
|
|