>
Fa   |   Ar   |   En
   قطعه‌بندی معنایی تصاویر خودروهای خودران با بهره‌گیری از روش معلم دانش‌آموز  
   
نویسنده خسرویان امیر ,مسیح طهرانی مسعود ,امیرخانی عبدالله
منبع پدافند الكترونيكي و سايبري - 1400 - دوره : 9 - شماره : 4 - صفحه:1 -19
چکیده    قطعه‌بندی معنایی یکی از رایج‌ترین خروجی‌های پردازش تصویری برای خودروهای خودران مجهز به بینایی است. مدل‌های مبتنی بر یادگیری عمیق جهت یاد گرفتن ویژگی‌های محیطی جدید و با دامنه متفاوت نیازمند در اختیار داشتن انبوهی از داده هستند. اما فرآیند برچسب‌گذاری دستی این حجم از داده توسط انسان بسیار زمان‌بر خواهد بود. در حالی که رویکرد بسیاری از مقالات مبتنی بر آموزش مدل‌های یادگیری عمیق با روش نظارتی است، در این مقاله از روش نیمه نظارتی جهت اعمال قطعه‌بندی معنایی بهره گرفته می‌شود. به‌طور دقیق‌تر در این پژوهش، روش معلم دانش‌آموز جهت برقراری تعامل میان مدل‌های یادگیری عمیق به‌ کار گرفته می‌شود. در ابتدا مدل‌های dabnet و contextnet در جایگاه معلم با استفاده از پایگاه داده bdd100k آموزش داده می‌شوند. با توجه به اهمیت قابلیت تعمیم پذیری و مقاوم بودن مدل‌های مورد استفاده در خودروهای خودران، این معیارهای شبکه‌های معلم با شبیه‌سازی در نرم‌افزار carla مورد ارزیابی قرار گرفته‌اند. سپس شبکه‌های معلم، پایگاه داده cityscapes را به‌طور کامل و بدون دخالت انسان در فرآیند آموزش با بهره‌گیری از یادگیری نیمه نظارتی به مدل fastscnn آموزش داده‌اند. برخلاف سایر رویکردهای نیمه نظارتی، وجود دو پایگاه داده با اختلاف دامنه قابل توجه، روش معلم دانش‌آموز را بیشتر به چالش خواهد کشید. نتایج نشان می‌دهد عملکرد مدل دانش‌آموز در کلاس‌هایی نظیر خودرو، انسان و جاده که شناسایی آن‌ها از مهم‌ترین اولویت‌های خودرو خودران است به‌ترتیب به میزان 1.2%، 3% و 3.8% با برچسب‌گذاری دستی اختلاف دارد. همچنین میانگین دقت مدل دانش‌آموز نیز تنها 4.5% اختلاف عملکرد با مدلی دارد که آماده‌سازی پایگاه داده آن نیازمند صرف زمان بسیار زیاد است.
کلیدواژه خودرو خودران، شبکه‌های عصبی پیچشی، قطعه‌بندی معنایی، روش معلم دانش‌آموز
آدرس دانشگاه علم و صنعت, دانشکده مهندسی خودرو, ایران, دانشگاه علم و صنعت, دانشکده مهندسی خودرو, ایران, دانشگاه علم و صنعت, دانشکده مهندسی خودرو, ایران
پست الکترونیکی amirkhani@iust.ac.ir
 
   The Semantic Segmentation of Autonomous Vehicles Images with the TeacherStudent Technique  
   
Authors Khosravian Amir ,Masih-Tehrani Masoud ,Amirkhani Abdollah
Abstract    Semantic segmentation is one of the most common image processing outputs for visionbased autonomous vehicles. Deep neural networks require largescale data in order to learn new environment features with diverse domains. While the approach of a great deal of papers is based on supervised learning, in this paper, semantic segmentation has been implemented by taking advantage of the semisupervised learning method. To be more specific, in this study the teacherstudent technique is utilized to establish a connection for the interaction between the deep learning models. First, the DABNet and ContextNet models are trained as our teacher networks with the BDD100K database. Regarding the significance of generalization and robustness of models in autonomous vehicles, these criteria of the teacher models have been evaluated by simulations in CARLA software. Finally, teacher networks train the FastSCNN model automatically using the Cityscapes database without any human interference. In contrast with other semisupervised approaches, the existence of two different databases with noticeable amount of domainshift effect would challenge the studentteacher technique even more. The results indicate that student’s performance in classes such as vehicles, pedestrians, and road, which are the highest priority classes to detect, has only 1.2%, 3%, and 3.8% accuracy difference, respectively. Also, there is a 4.5% drop for the model’s mean intersection over union accuracy between the teacher’s performance and a similar model trained with an entirely supervised method. Also, the mean accuracy for the student model has only 4.5% difference in performance with a model whose data base needs a long time for preparation.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved