>
Fa   |   Ar   |   En
   ناوبری خود مختار پهپاد در گذرگاه‌های باریک بدون سامانه موقعیت‌یابی جهانی با یادگیری تقویتی عمیق  
   
نویسنده شهبازی خجسته مهدی ,سلیمی بدر آرمین
منبع علوم رايانشي - 1403 - دوره : 9 - شماره : 4 - صفحه:12 -28
چکیده    هواپیمای بدون سرنشین (پهپاد) به دلیل هزینه‌های عملیاتی پایین و انعطاف‌پذیری بالا، در زمینه‌هایی نظیر نقشه‌برداری، جستجو و نجات، نظارت و اکتشاف کاربرد گسترده‌ای یافته‌اند. با این وجود، ناوبری کارآمد و عبور موفق از گذرگاه‌های باریک در محیط‌های پیچیده، بدون استفاده از حسگرهای گران‌قیمت همچنان یک چالش اساسی محسوب می‌شود. تحقیقات پیشین اغلب به استفاده از حسگرهای پیشرفته یا روش‌های غیربهینه مبتنی بوده‌اند که عملکرد ضعیفی در شرایط متغیر محیطی نشان می‌دهند. این رویکردها برای جلوگیری از تشخیص نادرست موانع و بهبود قابلیت اطمینان و ایمنی بر چندین حسگر مانند فراصوت، مادون‌قرمز، لیدار و دوربین تکیه می‌کنند. این روش‌ها به دلیل نیاز به پردازش حجم زیادی از داده‌ها، دارای سربار محاسباتی بالا هستند و عملکرد آن‌ها در شرایط محدودیت منابع بهینه نیست. علاوه بر این، این روش‌ها معمولاً از قابلیت تعمیم‌پذیری کافی برخوردار نیستند. از طرف دیگر، رویکردهای برنامه‌ریزی مسیر نظیر روش‌های مبتنی بر جستجو در گراف، میدان پتانسیل و مبتنی بر نمونه‌برداری، علی‌رغم تحلیل‌پذیری، در تطبیق با تغییرات مدل یا محیط دچار چالش می‌شوند و به مکان‌های‌ مقیاس کوچک محدود می‌شوند و برای کاربردهای دنیای واقعی دقت کافی ندارند. به همین منظور، در این مقاله یک سامانه ناوبری خودمختار مبتنی بر یادگیری تقویتی عمیق و استفاده از تصاویر عمقی ارایه شده است. در این روش، مسئله تصمیم‌گیری به‌عنوان یک فرآیند تصمیم‌گیری مارکوف مدل‌سازی می‌شود تا پهپاد با اتکا به اطلاعات کنونی قابلیت تصمیم‌گیری را داشته باشد. همچنین، از شبکه‌های عصبی هم‌آمیختی برای استخراج ویژگی‌های بصری از تصاویر عمقی استفاده می‌شود. برای اتخاذ یک سیاست تصمیم‌گیری مناسب، از الگوریتم بهینه‌سازی سیاست تقریبی برای آموزش مدل بهره گرفته شده است. سامانه پیشنهادی در یک محیط شبیه‌سازی‌شده واقع‌گرایانه آزمایش شده و عملکرد آن مورد ارزیابی قرار گرفته است. نتایج آزمایش‌ها نشان می‌دهد که روش پیشنهادی توانسته است با 85 درصد موفقیت و 15 درصد میزان برخورد، مسیر گذرگاه‌های باریک را طی کند و با 17 درصد بهبود، عملکرد بهتری نسبت به روش‌های قیاس شده مرجع ارایه دهد. علاوه بر این، افزایش مداوم پاداش در طول فرآیند آموزش، کاهش بار محاسباتی و قابلیت تعمیم‌پذیری به شرایط محیطی مختلف، نظیر تغییر در پیکربندی محیط یا شکل گذرگاه‌ها، از دیگر مزایای این روش به شمار می‌روند. رویکرد پیشنهادی در آزمایش‌های تعمیم‌پذیری توانسته موفقیت 100 درصد را کسب کند. این رویکرد می‌تواند به‌عنوان یک راهکار مقرون‌به‌صرفه و کارآمد به‌ویژه در شرایطی که استفاده از حسگرهای گران‌قیمت امکان‌پذیر نیست مورد استفاده قرار گیرد.
کلیدواژه هواپیمای بدون سرنشین، مسیریابی خودکار، اجتناب از مانع، یادگیری تقویتی عمیق، بهینه‌سازی سیاست تقریبی
آدرس دانشگاه شهید بهشتی, دانشکده مهندسی و علوم کامپیوتر, ایران, دانشگاه شهید بهشتی, دانشکده مهندسی و علوم کامپیوتر, ایران
پست الکترونیکی a_salimibadr@sbu.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved