بهینه‌سازی ساختاری شبکه عصبی عمیق سلسله مراتبی خودتوجه و رمزگذاری پویای تک متغیره برای بزرگ نمایی تصاویر دیجیتال

Fa | Ar | En

بهینه‌سازی ساختاری شبکه عصبی عمیق سلسله مراتبی خودتوجه و رمزگذاری پویای تک متغیره برای بزرگ نمایی تصاویر دیجیتال


نویسنده	دلشادی علی ,مهرداد وحید ,دولتشاهی محمدباقر
منبع	ماشين بينايي و پردازش تصوير - 1402 - دوره : 10 - شماره : 3 - صفحه:47 -63
چکیده	بزرگ‌نمایی تصاویر دیجیتالی یکی از روش‌های پردازش تصویر می‌باشد، که وضوح تصویر را در زمینه دید رایانه‌ای بهبود می بخشد. در اصل این کار برای بزرگ‌نمایی تصاویر ثابت ومتحرک که از زمان تصویر‌برداری آن‌ها گذشته و دسترسی به دوربین یا صحنه‌ها برای زوم وجود ندارد، استفاده می‌شود. در این مقاله از شبکه سلسله مراتبی جهت استخراج ویژگی‌های سطح بالا برای حل چالش مرز‌بندی بین رنگ‌ها و از بلوک‌های توجه خود‌آموز برای کاهش عملیات کانولوشن پیشنهاد می‌شود. در ادامه برای بهینه‌سازی شبکه از روش جستجو تصادفی و تقسیم دودویی برای یافتن پاسخ بهینه پارامتر‌ها و فراپارامتر‌ها استفاده می گردد. با استفاده از روش جستجوی ذکر شده علاوه بر جستجوی وزن‌ها و پارامتر‌های شبکه، میتوان ساختار معماری را نیز جستجو کرد، این عمل باعث تنظیم خودکار فراپارامترها و بهینه سازی ساختار شبکه خواهد شد. برای بررسی کارایی روش پیشنهادی، نتایج شبیه‌سازی بر روی پایگاه داده تصاویر در این حوزه تست شده که این نتایج برتری روش پیشنهادی نسبت به روش‌های دیگر را نمایش می‌دهد. باتوجه به نتایج بدست آمده در بهینه سازی معماری با استفاده از روش ذکرشده در بزرگ-نمایی چهار برابر با بلوک سلسله مراتبی چهار طبقه و استفاده از بلوک توجه در بخش بزرگ‌نمایی به عدد سیگنال به نویز 66/32 دست یافت.
کلیدواژه	بزرگنمایی تصاویر دیجیتال، شبکه عصبی عمیق سلسله مراتبی، بهینه سازی ساختاری، بهینه سازی پویای تک متغیره، بلوک توجه
آدرس	دانشگاه لرستان, ایران, دانشگاه لرستان, گروه برق, ایران, دانشگاه لرستان, گروه کامپیوتر, ایران
پست الکترونیکی	dowlatshahi.mb@lu.ac.ir

structural optimization of self-attention hierarchical deep neural network and dynamic one-variable encoding for magnification of digital images

Authors	delshadi alli ,mehrdad vahid ,dowlat shahi mohammad bager
Abstract	enlarging digital images is one of the image processing methods, which improves the image in the field of computer vision. basically, this is used to zoom in on still and moving images that have passed the time of their capture and there is no access to the camera or scenes to zoom. in this article, a hierarchy is proposed to extract high-level features to solve the demarcation challenge between colors and self-learning attention blocks to reduce convolution operations. in the following, to optimize the network, random search and binary division are used to find optimal answers and meta-parameters. using the mentioned search method, in addition to searching for network weights and networks, i can also search for the architecture of the structure, this action will automatically generate meta-parameters and optimize the network structure. to check the effectiveness of the proposed method, simulation results on the database in this area have been determined, which show that the proposed method is superior to other methods. according to the results obtained in architecture, by using the four-fold magnification mentioned in the four-story series block and using the attention block in the magnification section, the display-to-noise number was 32.66.