|
|
بهبود کارایی شبکه عصبی کانولووشنال با استفاده از تابع ضرر وزن دار افزایشی برای مقابله با نامتوازنی دستهای
|
|
|
|
|
نویسنده
|
محمودی نسیبه ,شیرازی حسین ,فخردانش محمد ,داداش تبار کوروش
|
منبع
|
پدافند الكترونيكي و سايبري - 1402 - دوره : 11 - شماره : 4 - صفحه:17 -31
|
چکیده
|
با توجه به اینکه بیشتر مسائل دنیای واقعی از ﻗﺒﯿﻞ تشخیص تقلب، شناسایی خطا، ﺗﺸﺨﯿﺺ ﻧﺎﻫﻨﺠﺎری، ﺗﺸﺨﯿﺺ ﭘﺰشکی و تشخیص بدافزار نامتوازن هستند، دسته بندی داده ﻫﺎ در مسائل ﻧﺎمتوازن ﺑﻪ ﻋﻨﻮان یکی از ﭼﺎﻟﺶ ﻫﺎی اصلی در حوزة داده ﮐﺎوی، ﻣﻮرد ﺗﻮﺟﻪ ﺑﺴﻴﺎری از ﻣﺤﻘﻘﺎن و ﭘﮋوﻫﺶﮔﺮان ﻗﺮارﮔﺮﻓﺘﻪ اﺳﺖ. در یادگیری نامتوازن، ﻣﻌﻤﻮﻻ ﺗﻌﺪاد ﻧﻤﻮﻧﻪ ﻫﺎی یکی از دسته ﻫﺎ ﺧﯿلی ﺑﯿﺸﺘﺮ از ﻧﻤﻮﻧﻪﻫﺎی دسته دیگر اﺳﺖ و یا هزینه دسته بندی اشتباه در دودسته متفاوت است. شبکه های عصبی کانولووشنال بهرغم موفقیت های چشمگیری که در دسته بندی داده ها دارند، در مسائل نامتوازن با مشکل مواجه می شوند چرا که آنها بهصورت پیش فرض، ﺗﻮزﯾﻊ دسته ﻫﺎ را متوازن و هزینه دسته بندی را مساوی در ﻧﻈﺮ ﮔﺮﻓﺘﻪ می گیرند، ازاینرو در دسته بندی نامتوازن، نمی توان به ﻧﺘﺎﯾﺞ قابلقبولی دستیافت؛ زﯾﺮا شبکه ﺑﻪ ﺳﻤﺖ ﻧﻤﻮﻧﻪ ﻫﺎی آﻣﻮزشی دسته ﺑﺰرگ ﺗﺮ ﻣﺘﻤﺎﯾﻞ میشود ﮐﻪ اﯾﻦ ﻣﻮﺿﻮع ﺳﺒﺐ اﻓﺰاﯾﺶ ﺗﻌﺪاد ﺧﻄﺎﻫﺎ در تشخیص نمونه ﻫﺎی ﻣﺜﺒﺖ می ﺷﻮد. یکی از راهکارهای کم هزینه برای غلبه بر نامتوازنی داده ها در شبکه های عصبی کانولوشنال استفاده از تابع ضرر به نفع دسته اقلیت است، در این مقاله تابع ضرری جدیدی معرفی شده است که بهصورت تدریجی و با پیشرفت آموزش، اهمیت دسته اقلیت را افزایش می دهد تا در انتهای آموزش به مقدار مشخص شده برسد و از اهمیت داده های دسته اکثریت بکاهد، این امر باعث می شود تا هم بتوانیم از قدرت آموزشی همه داده ها استفاده کنیم و هم از غلبه داده های دسته اکثریت جلوگیری کنیم. نتایج آزمایش روی سه مجموعهدادة مصنوعی، تشخیص فعالیت های انسان و cifar-10، همگرایی و کارایی روش پیشنهادی را نشان می دهند، روش پیشنهادی با روش های آدابوست مبتنی بر درخت تصمیم، شبکه کانولوشنال مبتنی بر آنتروپی متقابل و آنتروپی متقابل وزن دار، روش smote و روش cnn تجمعی مقایسه شده است. به ترتیب با کسب دقت 94.6، 92.92 و 69.23 در سه مجموعه داده (cifar-10 با نرخ نامتوازنی 5 درصد) توانست از دیگر روش ها پیشی بگیرد و دقت در مجموعه داده مصنوعی نسبت به روش سنتی آدابوست مبتنی درخت تصمیم، 17.72 بالاتر است.
|
کلیدواژه
|
نامتوازنی دستهای، یادگیری عمیق، تابع ضرر، آنتروپی متقابل
|
آدرس
|
دانشگاه صنعتی مالک اشتر, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه صنعتی مالک اشتر, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه صنعتی مالک اشتر, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه صنعتی مالک اشتر, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
dadashtabar@mut.ac.ir
|
|
|
|
|
|
|
|
|
improving the performance of the convolutional neural network using incremental weight loss function to deal with class imbalanced data
|
|
|
Authors
|
mahmoodi n. ,shirazi h. ,fakhredanesh m. ,dadashtabar k.
|
Abstract
|
class-imbalanced datasets are common in many real-world domains, such as health, banking, and security. machine learning researchers have recently focused on the classification of such datasets, where the costs of different types of misclassifications are unequal, the classes have different prior probabilities, or both. the performance of most standard classifier learning algorithms is significantly affected by class imbalance, where the algorithms are often biased toward the majority class instances despite recent advances in deep learning. however, there is very little empirical work on deep learning with class imbalance.to address this issue, we propose an incremental weighted cross entropy loss function. the proposed method involves gradually increasing the weight of the minority class as the training progresses, until it reaches the specified amount at the end of the training. through experiments, we demonstrate the convergence and efficiency of the proposed method. the results of experiments on three datasets, including artificial datasets, human activity recognition dataset, and cifar-10, demonstrate the convergence and performance of the proposed method. the proposed method is compared with decision tree-based adaboost, cross entropy-based convolutional neural network, weighted cross entropy -based cnn, smote method, and ensemble cnns method. with accuracy gains of 94.6%, 92.92%, and 69.23% on the three datasets (cifar-10 with 5% imbalance rate), the proposed method outperformed the other methods. additionally, the accuracy on the artificial dataset was 17.77% higher than the traditional decision tree-based adaboost method.
|
Keywords
|
class-imbalanced dataset ,convolutional neural network ,loss function ,cross-entropy
|
|
|
|
|
|
|
|
|
|
|