|
|
کنترل آرایش گروهی بهینه پرندههای بدون سرنشین با قید عدم برخورد و دینامیک ناشناخته
|
|
|
|
|
نویسنده
|
مهدوی گلمیشه فاطمه ,شمقدری سعید
|
منبع
|
مكانيك هوافضا - 1402 - دوره : 19 - شماره : 1 - صفحه:61 -79
|
چکیده
|
این مقاله رویکرد آموزش توزیعشدهای را برای سیستمی با چند پرنده بدون سرنشین غیرخطی و ناهمگن، جهت حل مسئله کنترل آرایش گروهی ایمن و بهینه ارائه مینماید. هدف کنترل، تضمین ایمنی در حین دستیابی به عملکرد مطلوب است. برای این منظور دو کنترلکننده موقعیت و زاویه بهصورت سری در نظر گرفتهشده است. ابتدا، طراحی کنترل آرایش گروهی بهینه بهعنوان عملکرد بهینه در کنترل موقعیت تعریفشده و توسط تابع هزینه مدلسازی میشود. در این مقاله، از طریق ادغام توابع هزینه با توابع کنترل مانع (control barrier function (cbf)) محلی، مسائل بهینهسازی توزیعشده جدیدی معرفی میگردد. وجود cbf محلی در تابع هزینه افزوده موجب تضمین ایمنی در کنترل موقعیت شده و درنتیجه برخوردی در طول مسیر پرندهها رخ نمیدهد. در روش ارائهشده، کنترلکنندههای ایمن و بهینه موقعیت از حل مسائل بهینهسازی نامقید بهجای مسائل بهینهسازی مقید به دست میآیند. در مرحله بعد، از کنترل موقعیت مجازی حاصل، زوایای مرجع به دست میآید. ردیابی بهینه این زوایا بهعنوان عملکرد مطلوب در کنترل زاویه در نظر گرفتهشده و با تابع هزینه مرتبط مدلسازی میشود. درنهایت، پایداری و ایمنی کنترلکنندههای پیشنهادی اثبات میشود. این سیاستهای بهینه و ایمن با استفاده از الگوریتمهای یادگیری تقویتی چندعاملی (multi-agent reinforcement learning (marl)) خارج از روال مرسوم، طراحیشده و به دانشی از دینامیک پرندهها نیاز ندارد. الگوریتمهای پیشنهادی از طریق شبیهسازی مسئله کنترل آرایش گروهی 6 پرنده با قید عدم برخورد ارزیابی میشوند.
|
کلیدواژه
|
پرنده بدون سرنشین، سیستم چندعاملی، کنترل آرایش گروهی، یادگیری تقویتی ایمن، یادگیری تقویتی مستقل از مدل
|
آدرس
|
دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی برق, ایران
|
پست الکترونیکی
|
shamaghdari@iust.ac.ir
|
|
|
|
|
|
|
|
|
optimal formation control for unmanned aerial vehicle teams with collision avoidance constraint and unknown dynamics
|
|
|
Authors
|
mahdavi golmisheh fatemeh ,shamaghdari saeed
|
Abstract
|
this paper presents distributed training approach for a nonlinear and heterogeneous multi-uav system to solve a safe and optimal formation control problem. the objective of control is to ensure safety while achieving optimal performance. in this regard, the position and attitude controllers are considered in series. first, the optimal formation control design is defined as the optimal performance in position control and is modeled by the cost function. in this article, with the integration of cost functions and local control barrier functions (cbfs), a novel distributed optimization problems are introduced. existing the local cbf in the augmented cost function ensures the safety of the position control, and as a result, collisions do not occur along the path of uavs. the proposed method considers the safe and optimal position controllers by solving unconstrained optimization problems instead of constrained ones. in the next stage, the reference attitudes are driven by virtual position control. the attitude tracking optimal control is considered the optimal performance in the attitude control, and the related cost function models it. finally, the stability and safety of the proposed controllers are proven. these optimal and safe policies are obtained sequentially using off-policy multi-agent reinforcement learning (marl) algorithms which do not require knowledge of uavs’ dynamics. the proposed algorithms are validated by simulating the formation control problem of 6 uavs with collision avoidance constraints.
|
Keywords
|
unmanned aerial vehicles (uav) ,multi-agent system ,formation control ,reinforcement learning (rl) ,model-free rl
|
|
|
|
|
|
|
|
|
|
|