|
|
ارائه روشی ترکیبی برای مسیریابی ربات خودمختار
|
|
|
|
|
نویسنده
|
خلیلی علی ,شجاعیان افشین
|
منبع
|
اولين همايش ملي فرماندهي و مديريت در جنگ هاي آينده - 1402 - دوره : 1 - اولین همایش ملی فرماندهی و مدیریت در جنگ های آینده - کد همایش: 02231-98711 - صفحه:0 -0
|
چکیده
|
امروزه با پیشرفت هوش مصنوعی و استفاده از آن در ربات ها روش های جنگ از گذشته تاکنون دستخوش تغییرات شده است لذا جنگ های آینده با تصویری که در ذهن ما است متفاوت خواهد بود. ربات ها با توجه به ویژگی هایی که دارند، می توانند در بیشتر مواقع عملکردی بهتری از انسان ها داشته باشند. هدف از انجام این تحقیق ارائه روشی ترکیبی برای مسیریابی ربات خودمختار است. برای انجام این کار، از ترکیب ویژگیهای سیستمهای فازی، یادگیری تقویتیq و شبکه ی عصبیrbf ، جهت برآورده کردن نیازمندی مسیریابی ربات خودمختار متحرک زمینی استفاده شده است. ساختار سیستم فازی و قواعد اگر-آنگاه آن، در حالیکه تصمیم گیری در محیط های ناشناخته را فراهم می کند، امکان به کارگیری دانش اکتشافی به دست آمده از بررسی محیط توسط فرد خبره را نیز میسر می کند. در عین حال، می توان الگوریتم یادگیریq ، به عنوان یک الگوریتم یادگیری تقویتی، را زمانی که شناخت کمی از محیط وجود دارد، ابزاری مناسبی برای تنظیم فرآیند استنتاج سیستم فازی دانست. در این الگوریتم محیط به صورت زوجی از حالت-اقدام مدلسازی می شود. به منظور کنترل ربات توسط ابزارهای ذکر شده، هر حالت ابتدا فازی سازی شده و سپس برای هر یک از این حالات فازی سازی شده تعدادی اقدام متناظر در نظر گرفته می شود. این نگاشت بین حالات و اقدامات توسط مجموعه قواعد اگر-آنگاه فازی، که حاصل استدلال انسانی است، انجام می شود. سپس ربات اقدامی با بیشتر مقدار پاداش را انتخاب و اعمال می نماید. در عین حال شبکه عصبیrbf ، به عنوان یک تخمین زننده عمومی، جهت تعیین پارامترهای توابع عضویت فازی و آستانه جریمه برای تابع جریمه الگوریتم یادگیریq ، به کار گرفته می شود.
|
کلیدواژه
|
فازی، یادگیریq ، شبکه عصبیrbf ، رباتkhepera
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|