|
|
یک معماری جدید از شبکهyolov5 با بکارگیری مکانیسم توجه برای بهبود مصالحه دقت-سرعت در آشکارسازی میوه سیب
|
|
|
|
|
نویسنده
|
محمودی فر مرضیه ,فرجی ندا
|
منبع
|
ماشين بينايي و پردازش تصوير - 1402 - دوره : 10 - شماره : 4 - صفحه:1 -14
|
چکیده
|
آشکارسازی میوه با توجه به شرایط روشنایی متفاوت، انسداد و همپوشانی یک کار چالشبرانگیز در رباتهای برداشت مبتنی بر بینایی ماشین است. هدف از این مقاله بهبود مصالحه دقت-سرعت در آشکارسازی میوه سیب در سیستم بینایی رباتهای برداشت کننده کشاورزی است. با توجه به کاربردهای اخیر ماژولهای توجه در زمینه آشکارسازی شیء، معماری جدیدی از شبکه yolov5 پیشنهاد شده است که در آن ماژول توجه کانالی eca در ستون فقرات شبکه، جایگزین ماژول c3 شده است. ماژول eca علیرغم کاهش تعداد پارامترهای شبکه اثر قابل توجهی در کارایی آشکارسازی نداشت و با افزایش سرعت به میزان% 22نسبت به yolov5 نسخه نانو، توانست مصالحه بهتری بین دقت و سرعت برقرار کند. برای ارزیابی معماری پیشنهادی از سه نوع مجموعه داده kfuji، minneapple و acfr در مرحله آموزش و آزمون استفاده شد و در حالتی که پایگاه داده آموزش و آزمون یکی نبودند، روش یادگیری انتقالی برای بهبود نتایج آزمون به کار گرفته شد. در حالتی که دادههای آموزش و آزمون یکی بودند، استفاده از معماری پیشنهادی منجر به بهبود نسبی عدد مصالحه به میزان 21.2% در مقایسه با ماژول c3 شد و در حالت یادگیری انتقالی که دادههای آموزش و آزمون یکی نبودند، بهبود نسبی 18% در عدد مصالحه به دست آمد.
|
کلیدواژه
|
آشکارسازی، مصالحه دقت-سرعت، ماژول توجه، یادگیری انتقالی، yolov5
|
آدرس
|
دانشگاه بینالمللی امام خمینی(ره), ایران, دانشگاه بینالمللی امام خمینی(ره), دانشکده فنی و مهندسی, گروه مهندسی برق, ایران
|
پست الکترونیکی
|
nfaraji@aut.ac.ir
|
|
|
|
|
|
|
|
|
a novel architecture of yolov5 network using attention mechanism to improve accuracy-speed trade-off of apple fruit detection
|
|
|
Authors
|
mahmoudifar marziye ,faraji neda
|
Abstract
|
fruit detection due to different lighting conditions, occlusion and overlap is a challenging task in machine vision-based harvesting robots. the aim of this article is to improve the accuracy-speed trade-off in apple fruit detection in the vision system of agricultural harvesting robots. considering the recent applications of attention modules in the field of object detection, we have proposed a new architecture of yolov5 network in which the eca channel attention module is replaced by the c3 module in the backbone of the network. despite reducing the number of network parameters, the eca module has not had a significant effect on the detection efficiency, and by increasing the speed by 22% compared to the yolov5 nano version, it has been able to establish a better trade-off between accuracy and speed. to evaluate the proposed architecture, three datasets kfuji, minneapple and acfr are used in the training and testing phase, and in the case that the training and testing databases are not the same, the transfer learning method is used to improve the test results. in the case where the training and test data are the same, the use of the proposed architecture leads to a relative improvement of the trade-off by 21.2% compared to the c3 module. in the case of transfer learning where the training and test data are not the same, a relative improvement of 18% in the trade-off has been achieved.
|
Keywords
|
yolov5
|
|
|
|
|
|
|
|
|
|
|