|
|
طراحی تنظیمکنندهی خروجی بهینهی مبتنی بر یادگیری تقویتی ایمن با استفاده از تابع مانع کنترلی نمایی
|
|
|
|
|
نویسنده
|
اصغری سیدرضا ,شمقدری سعید
|
منبع
|
كنفرانس بين المللي مهندسي برق - 1401 - دوره : 30 - کنفرانس بین المللی مهندسی برق - کد همایش: 01220-26721 - صفحه:0 -0
|
چکیده
|
یکی از روشهای حل مسئله تنظیمکنندهی خروجی بهینه برای یک سیستم زمان-گسسته، استفاده از کنترلکننده مبتنی بر یادگیری تقویتی میباشد و این در حالی است که در حضور محدودیتهای ایمنی، این امکان وجود دارد که استفاده از آن کنترلکننده، سبب بروز رفتارهای پرخطر در کاربردهای دنیای واقعی گردد. از این رو، در این مقاله، ضمن تبیین الگوریتم off-policy مستقل از مدل، فیلتر مبتنی بر تابع مانع کنترلی نمایی به منظور تحقق محدودیتهای ایمنی، معرفی میگردد. این فیلتر، در قالب یک مسئله بهینهسازی مرتبه-دوم، با توسعه مفهوم تابع مانع کنترلی نمایی و ترکیب آن با رگرسیون فرآیند گوسی، این امکان را ایجاد میکند که محدودیتهای مدنظر برای ورودیهای کنترلی و حالتهای سیستم، تحقق یابد. نتایج حاصل از اعتبارسنجی رویکرد پیشنهادی در کنترل سیستمهای چهار-تانک و دو-تانک نشان میدهند که رویکرد مدنظر با طراحی ورودی کنترلی مناسب توانایی لازم برای دفع اغتشاش و ردیابی مسیر مرجع را دارد و تحقق محدودیتهای مدنظر را نیز تضمین مینماید.
|
کلیدواژه
|
ایمنی، تابع مانع کنترلی نمایی، تنظیمکنندهی خروجی بهینه، سیستم چهار-تانک، سیستم دو-تانک، یادگیری تقویتی
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
shamaghdari@iust.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|