طراحی تنظیم‌کننده‌ی خروجی بهینه‌ی مبتنی بر یادگیری تقویتی ایمن با استفاده از تابع مانع کنترلی نمایی

Fa | Ar | En

طراحی تنظیم‌کننده‌ی خروجی بهینه‌ی مبتنی بر یادگیری تقویتی ایمن با استفاده از تابع مانع کنترلی نمایی


نویسنده	اصغری سیدرضا ,شمقدری سعید
منبع	كنفرانس بين المللي مهندسي برق - 1401 - دوره : 30 - کنفرانس بین المللی مهندسی برق - کد همایش: 01220-26721 - صفحه:0 -0
چکیده	یکی از روش‌های حل مسئله تنظیم‌کننده‌ی خروجی بهینه برای یک سیستم زمان-گسسته، استفاده از کنترل‌کننده‌ مبتنی بر یادگیری تقویتی می‌باشد و این در حالی است که در حضور محدودیت‌های ایمنی، این امکان وجود دارد که استفاده از آن کنترل‌کننده، سبب بروز رفتارهای پرخطر در کاربردهای دنیای واقعی گردد. از این رو، در این مقاله، ضمن تبیین الگوریتم off-policy مستقل از مدل، فیلتر مبتنی بر تابع مانع کنترلی نمایی به منظور تحقق محدودیت‌های ایمنی، معرفی می‌گردد. این فیلتر، در قالب یک مسئله بهینه‌سازی مرتبه-دوم، با توسعه مفهوم تابع مانع کنترلی نمایی و ترکیب آن با رگرسیون فرآیند گوسی، این امکان را ایجاد می‌کند که محدودیت‌های مدنظر برای ورودی‌های کنترلی و حالت‌های سیستم، تحقق یابد. نتایج حاصل از اعتبارسنجی رویکرد پیشنهادی در کنترل سیستم‌های چهار-تانک و دو-تانک نشان می‌دهند که رویکرد مدنظر با طراحی ورودی کنترلی مناسب توانایی لازم برای دفع اغتشاش و ردیابی مسیر مرجع را دارد و تحقق محدودیت‌های مدنظر را نیز تضمین می‌نماید.
کلیدواژه	ایمنی، تابع مانع کنترلی نمایی، تنظیم‌کننده‌ی خروجی بهینه، سیستم چهار-تانک، سیستم دو-تانک، یادگیری تقویتی
آدرس	, iran, , iran
پست الکترونیکی	shamaghdari@iust.ac.ir



Authors