|
|
کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی q-learning
|
|
|
|
|
نویسنده
|
صابری سجاد ,چترایی عباس ,شجاعی خوشنام
|
منبع
|
اولين كنفرانس بين المللي و هفتمين كنفرانس ملي مهندسي برق و سيستمهاي هوشمند - 1402 - دوره : 7 - اولین کنفرانس بین المللی و هفتمین کنفرانس ملی مهندسی برق و سیستمهای هوشمند - کد همایش: 02230-47907 - صفحه:0 -0
|
چکیده
|
در این مقاله، کنترل بهینه سیستم های رباتیک با دینامیک نامعلوم با استفاده از روش یادگیری تقویتی ارائه شده است. از بین روش های مختلف یادگیری تقویتی، در اینجا از الگوریتم q-learning مبتنی بر تکنیک تکرار سیاست استفاده شده است. در این الگوریتم از ساختار بازیگر-منتقد بهره گرفته می شود، که بر اساس آن معادله غیرخطی همیلتون-یاکوبی-بلمن بطور بر خط و با استفاده از شبکه های عصبی حل شده است. در ضمن با وجود دینامیک نامعلوم پلنت، مسئله کنترل بهینه با مینیمایز کردن تابع هزینه حل می گردد. روش ارائه شده بر روی ربات تک لینکی به کار رفته و در نرم افزار متلب شبیه سازی شده است.
|
کلیدواژه
|
تکرار سیاست،ربات تک لینکی غیرخطی،روش q،learning،کنترل بهینه،یادگیری تقویتی
|
آدرس
|
, iran, , iran, , iran
|
پست الکترونیکی
|
khoshnam.shojaee@gmail.com
|
|
|
|
|
|
|
|
|
optimal control of nonlinear single-link robot by q-learning reinforcement learning method
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|