|
|
کنترل ردیاب وضعیت بهینه تحمل پذیر عیب کوادروتور در حضور قیود حالت و ورودی با استفاده از یادگیری تقویتی ایمن
|
|
|
|
|
نویسنده
|
روشن روان سجاد ,شمقدری سعید
|
منبع
|
مكانيك هوافضا - 1403 - دوره : 20 - شماره : 1 - صفحه:143 -162
|
چکیده
|
در این مقاله، به ارائه روشی جهت طراحی سیستم کنترل وضعیت ردیاب بهینه برای پرنده کوادروتور که در معرض عیوب اجزا و عملگر قرار دارد پرداختهشده است. روش کنترل تحمل پذیر عیب یکپارچه پیشنهادی مبتنی بر یادگیری تقویتی ایمن ارائه شده است و قادر است بدون نیاز به شناخت قبلی از دینامیک پرنده، قیود ورودی و حالات را تضمین نماید. به این منظور، روش بهینه پیشنهادی با ساختار شبکه عصبی دوگانه شامل شبکههای عصبی شناساگر-نقاد ارائهشده است. در قانون بهروزرسانی وزنهای شبکه شناساگر علاوه بر متغیر در نظر گرفتن ضریب فراموشی از روش پاسخ تجربه استفادهشده که باعث افزایش سرعت همگرایی و مقاومت نسبت به نویز اندازهگیری و کاهش خطای تخمین میشوند. در این روش، حل مسئله کنترل ردیاب وضعیت بهینه تحملپذیر عیب در حالت مقید با حل مسئله پایدارسازی بهینه نامقید برای یک سیستم افزوده معادل میشود که در آن قیود ورودی کنترلی و حالات به ترتیب با انتخاب تابع هزینه مناسب بر سیگنال ورودی و توابع کنترل مانع مناسب بر حالات، تضمین داده میشوند. همچنین آشکارسازی وقوع عیب بدون نیاز به هیچگونه بانکی از مدل یا فیلتر و صرفاً با مقایسه مقدار باقیمانده معادله همیلتون-ژاکوبی-بلمن با یک آستانه از پیش تعیینشده انجام میپذیرد. پایداری فراگیر یکنواخت وزنهای هر دو شبکه و درنتیجه همگرایی قانون کنترل به پاسخ بهینه با استفاده از قضیه لیاپانوف اثبات و با استفاده از نتایج شبیه سازی صحت عملکرد آن نشان داده شده است.
|
کلیدواژه
|
کنترل وضعیت کوادروتور، عیوب اجزا و عملگر، کنترل بهینه تحملپذیر عیب، آشکارسازی وقوع عیب، یادگیری تقویتی ایمن
|
آدرس
|
دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران
|
پست الکترونیکی
|
shamaghdari@iust.ac.ir
|
|
|
|
|
|
|
|
|
fault-tolerant optimal attitude tracking control of quadrotor subject to state and input constraints using safe reinforcement learning
|
|
|
Authors
|
roshanravan sajad ,shamaghdari saeed
|
Abstract
|
in this article, a method for designing a fault-tolerant optimal attitude tracking control (ftoatc) for a quadrotor uav subject to component and actuator faults is presented. the proposed fault-tolerant method is based on safe reinforcement learning (srl) and is capable of ensuring input and state constraints without the need for prior knowledge of the quadrotor dynamics. to this end, the proposed optimal method is presented with a dual neural network (nn) structure consisting of identifier-critic neural networks. in the identifier nn update law, in addition to considering the variable forgetting factor dependent on measurement noise, the experience response method is used, which increases convergence speed and robustness to measurement noise and reduces estimation error. in this method, solving the constrained ftoatc problem is equivalent to solving an unconstrained optimal stabilization problem for an augmented system, where control input constraints and states are guaranteed by selecting suitable cost functions on the input signal and appropriate control barrier functions (cbf)on the states, respectively. furthermore, fault detection is performed without the need for any model or filter bank, simply by comparing the residual value of the hamilton-jacobi-bellman (hjb) equation with a predetermined threshold. the uniformly ultimately boundedness (uub) of identifier and critic nn weight errors and, as a result, the convergence of the control input to the neighborhood of the optimal solution are all proved by lyapunov theory and the performance of the method is validated through simulation results.
|
Keywords
|
quadrotor attitude control ,component and actuator faults ,fault-tolerant optimal control ,fault detection ,safe reinforcement learning
|
|
|
|
|
|
|
|
|
|
|