>
Fa   |   Ar   |   En
   انتقال یادگیری از شبکه های عصبی کانولوشنال مبتنی بر رویکرد نوین تنظیم جزیی تکاملی برای طبقه بندی اصوات محیطی  
   
نویسنده ریاضتی سرشت حامد ,محمدی کریم
منبع سامانه هاي غيرخطي در مهندسي برق - 1402 - دوره : 10 - شماره : 1 - صفحه:60 -83
چکیده    مسئله کمبود نمونه های آموزش یکی از چالش های اصلی در به کارگیری شبکه های عصبی کانولوشنال عمیق برای طبقه بندی اصوات محیطی است. یکی از رویکرد های مورد توجه برای مواجه با چالش مذکور، انتقال یادگیری است که در آن مدلی از پیش آموزش دیده به روی دادگانی با ابعاد بزرگ، به کابرد هدف با اعمال تنظیمات جزیی تطبیق داده می شود. در این پژوهش، ما نشان می دهیم که در هر لایه همه نورون/کرنل ها تاثیر یکسانی در تشخیص نمونه های کلاس های مختلف ندارند، بلکه به ازای هر کلاس زیرگروهی خاص نقش اصلی و حیاتی را در طبقه بندی بازی می کند. از این رو و با توجه به وجود شباهت های زیاد بین برخی ازکلاس های مبدا و هدف، پیشنهاد می کنیم که تمرکز تنظیمات جزیی در هر لایه تنها معطوف به زیرگروهی از نورون/کرنل ها شود که به شدت نیازمند تغییرات هستند و مسئول اصلی خطا در طبقه بندی نمونه های ورودی هستند، و باقی دست نخورده رها شوند. برای شناسایی زیرگروه های مذکور، یک مسئله یادگیری تو در تو طرح می کنیم و یک رویکرد تکاملی موثر برای حل آن پیشنهاد می کنیم. ارزیابی روش پیشنهادی بیانگر بهبود مطلق به اندازه 1.9% و 2.3% در دقت طبقه بندی به ترتیب به روی دادگان های esc-50 و dcase-17 نسبت به روش مرسوم انتقال یادگیری است؛ بهبودی که بدون اضافه کردن داده جدید و تنها با بهره برداری موثرتر از دانش موجود در شبکه از پیش آموزش دیده بدست آمده است. همچنین، افزایش زمان آموزش به ازای روش تکاملی پیشنهادی کم و در حدود یک سوم زمان لازم برای آموزش شبکه از ابتدا برآورد شده است.
کلیدواژه یادگیری عمیق، شبکه های عصبی کانولوشنال، انتقال یادگیری، الگوریتم ژنتیک، طبقه بندی اصوات محیطی
آدرس دانشگاه علم و صنعت ایران, گروه مهندسی برق, ایران, دانشگاه علم و صنعت ایران, گروه مهندسی برق, ایران
پست الکترونیکی mohammadi@iust.ac.ir
 
   knowledge transfer of convolutional neural networks via a novel evolutionary fine-tuning strategy (efs) for environmental sound classification  
   
Authors riazati seresht hamed ,mohammadi karim
Abstract    insufficient training data is one of the main challenges of utilizing deep convolutional neural networks (cnns) for environmental sound classification (esc). as a promising solution, transfer learning (tl) has addressed this issue by adapting a network pre-trained on a large-scale dataset to the target task. in this paper, we demonstrate that not all neurons/kernels of every layer in cnn networks are equally utilized to process the inputs of different classes, but there is a specific subgroups of neurons/kernels in every layer that play the key role in classification of every output class. based on this observation and due to similarities that exist between feature spaces of some source and target classes, we propose to concentrate the fine-tuning process only on those neurons/kernels that do need changes and have the greatest impact on misclassifying target data. to identify these neurons/kernels, we pose a nested optimization problem for which we propose an effective evolutionary approach as solution.  compared to the conventional fine-tuning approach, our proposed method achieves absolute improvements of about 1.9% and 2.3% in accuracy on esc-50 and dcase-17, respectively; remarkable improvements produced not by adding augmented data but with a more efficient utilization of knowledge stored in the pre-trained network. it is noteworthy that the computation time overhead of the proposed evolutionary method is rather small (about one third of the time required to train the model from scratch.
Keywords deep learning ,convolutional neural networks ,transfer learning ,genetic algorithm ,environmental sound classification
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved