>
Fa   |   Ar   |   En
   طراحی یک شبکه عصبی کانولوشنال مبتنی بر بانک فیلتر برای طبقه بندی تصاویر اعداد دست نویس  
   
نویسنده دروگرمقدم علی ,کرمی ملایی محمدرضا ,حسن زاده محمدرضا
منبع پردازش علائم و داده ها - 1402 - شماره : 3 - صفحه:127 -140
چکیده    در سال های اخیر شبکه های عصبی کانولوشنال به طور فزاینده ای در کاربردهای مختلف بینایی ماشین و به ویژه در شناسایی و طبقه بندی خودکار تصاویر مورد استفاده قرار گرفته اند. این نوع از شبکه های عصبی مصنوعی با شبیه سازی عملکرد قشر بینایی مغز قدرتمندترین ساختار را در تجزیه و تحلیل داده های بصری دارند. اما تنوع تصاویر دیجیتال و گوناگونی محتوی و ویژگی های آن ها ایجاب می کند تا برای دستیابی به کارایی بالاتر در هر مسئله ی طبقه بندی، شبکه های کانولوشنال به صورت اختصاصی طراحی و پارامترهای آن ها به دقت تنظیم شوند. در این راستا، در پژوهش حاضر ضرایبی بهینه برای فیلترهای لایه ی کانولوشن در شروع آموزش شبکه بکار رفته تا از این طریق دقت طبقه بندی در شبکه افزایش و زمان آموزش کاهش یابد. این کار با طراحی و بکارگیری مجموعه ای از فیلترهای تخصصی برای لایه ی کانولوشن در قالب یک بانک فیلتر و جایگذاری آن ها به جای فیلترهای تصادفی انجام پذیرفته و بر روی پایگاه داده ی تصاویر اعداد دست نویس mnist ارزیابی شده است. آزمایشات ما بر روی شبکه ی کانولوشنال تک لایه با سه نوع فیلترگذاری (فیلترهای عدد ثابت، عدد تصادفی و بانک فیلتر) میانگین دقت طبقه بندی تصاویر اعداد دست نویس mnist را در 50 بار آموزش شبکه به ترتیب 74.94، 86.47 و 91.89 درصد و برای شبکه ی کانولوشنال سه لایه به ترتیب 88.82، 96.16 و 99.14 درصد نشان دادند. این نتایج نشان می دهند که فیلترهای بکار رفته در مدل پیشنهادی در مقایسه با فیلترهای تصادفی ویژگی های موثرتری از تصاویر را استخراج نموده و با شروع آموزش شبکه از نقطه ی مناسبتر، بدون افزایش هزینه ی محاسباتی دقت طبقه بندی را افزایش داده اند. بنابراین می توان نتیجه گرفت که ضرایب اولیه ی فیلترهای لایه ی کانولوشن بر دقت طبقه بندی شبکه های کانولوشنال موثر است و با بکارگیری فیلترهای موثرتر در لایه ی کانولوشن می توان این شبکه ها را خاص مسئله ساخته و از این طریق کارآیی شبکه را افزایش داد.       
کلیدواژه شبکه های عصبی کانولوشنال، یادگیری عمیق، طبقه بندی تصاویر، اعداد دست نویس، پایگاه داده mnist
آدرس دانشگاه صنعتی نوشیروانی بابل, دانشکده مهندسی برق و کامپیوتر, گروه مهندسی پزشکی-بیوالکتریک, ایران, دانشگاه صنعتی نوشیروانی بابل, دانشکده مهندسی برق و کامپیوتر, گروه مهندسی پزشکی-بیوالکتریک, ایران, دانشگاه صنعتی نوشیروانی بابل, دانشکده مهندسی برق و کامپیوتر, گروه مهندسی برق- الکترونیک, ایران
پست الکترونیکی m.hasanzadeh@nit.ac.ir
 
   design of a filter bank-based convolutional neural network for handwritten digit images  
   
Authors derogarmoghadam ali ,karami mollaei mohammad reza ,hassanzadeh mohammadreza
Abstract    background: in recent years, convolutional neural networks (cnns) have been increasingly used in various applications of machine vision. cnns simulate the function of the brain’s visual cortex and have a powerful structure for analyzing visual images. however, the diversity of digital images, their content, and their features necessitate that cnn networks are specially designed, and their parameters are carefully adjusted to achieve higher efficiency in any classification problem. in this regard, in many previous studies, researchers have attempted to increase the efficiency of the cnns by setting their adjustable parameters more accurately. new method: new method: in this study, we presented a novel initializing method for the kernels of the first convolutional layer of the cnn networks. we designed a filter bank with specialized kernels and used them in the first convolution layer of the proposed models. these kernels, compared to the random kernels in traditional cnns, extract more effective features from the input images without increasing the computational cost of the network, and improve the classification accuracy by covering all the important characteristics.results: the dataset used in this paper was the mnist database of handwritten digits. we examined the performance of cnn networks when three different types of kernels were used in their first convolution layer. the first group of kernels had constant coefficients; the second group had random coefficients, and finally, the kernels of the third group were specially designed to extract a wide range of image features. our experiments on a single-layer cnn network with three types of kernels (constant numbers, random numbers, and filter-bank) showed the average classification accuracy of mnist images in 50 times of network training to be 74.94%, 86.47%, and 91.89%, respectively, and for a three-layer cnn network, 88.82%, 96.16%, and 99.14%, respectively.comparison with existing methods: compared to the kernels with randomized coefficients, the use of specialized kernels in the first convolution layer of the cnn networks has several important advantages: 1) they can be designed to extract all important features of the input images, 2) they can be designed more effectively based on the problem in hand, 3) they cause the training to start from a more appropriate point, and in this way, the speed of training and the classification accuracy of the network increase.conclusion: this study provides a novel method for initializing kernels in convolution layers of cnn networks to enhance their performance in image classification works. our results show that compared to random kernels, the kernels used in the proposed models extract more effective features from the images at different frequencies and increase the classification accuracy by starting the training algorithm from a more appropriate point, without increasing the computational cost. therefore, it can be concluded that the initial coefficients of the convolution layer kernels are effective on the classification accuracy of cnn networks, and by using more effective kernels in the convolution layers, these networks can be made specific to the problem and, in this way, increase the efficiency of the network. 
Keywords convolutional neural network ,image classification ,handwritten digit ,mnist database
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved