>
Fa   |   Ar   |   En
   تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستم‌های دینامیکی  
   
نویسنده گوهری منش مسعود ,اکبری علی اکبر ,نقیبی سیستانی محمد باقر
منبع علوم كاربردي و محاسباتي در مكانيك - 1394 - دوره : 27 - شماره : 1 - صفحه:103 -116
چکیده    یادگیری تقویتی، روشی است که در آن عامل یا عاملان باتوجه به یک‌سری پاداش‌های مثبت و یا منفی، یک عمل بهینه را انجام می‌دهند. این روش، زمانی کارایی بسیار بالایی خواهد داشت که مدل سیستم به‌صورت طبیعی موجود نباشد و یا به‌دست آوردن آن موجب زحمت فراوان گردد. در این صورت می‌توان، آن را جایگزین مناسبی برای منطق‌های کنترلی دیگر دانست. یکی از معایب اساسی این روش، استفاده از عمل‌های گسسته در حین انجام آن می‌باشد. این در حالی است که خیلی از سیستم‌های دینامیکی با چنین رویکردی، عملکرد بهینه‌ای نخواهند داشت. برای جبران این نقیصه، رویکردهای متفاوتی از جمله تقریب مقادیر ظهور پیدا می کنند. در این مقاله از منطق فازی برای پیوسته کردن عمل‌های بهینه استفاده شده است. در این حالت، سیستم یادگیری تقویتی، قوانین بین کنترل‌کنندۀ فازی را در جهت نیل به بهینه‌ترین عمل تنظیم می‌نماید و به این ترتیب می تواند عمل‌های پیوسته‌ای را تولید نماید. به این منظور مدل یک آونگ معکوس در سیم مکانیکس در نظر گرفته شده است که توسط کنترل‌کننده طراحی شده است و حرکت آن در دو حالت کنترل زاویۀ آونگ و کنترل کامل آونگ و ارابه مورد بررسی قرار می گیرد. نتایج به‌دست آمده نشان می دهند، هوش مصنوعی به‌کار گرفته شده به‌جای انتخاب قوانین موجود، می تواند کارایی بالاتری در کنترل سیستم های دینامیکی داشته باشد.
کلیدواژه یادگیری تقویتی ,منطق فازی ,کنترل بهینه ,آونگ معکوس
آدرس دانشگاه فردوسی مشهد, دانشجوی دکتری, ایران, دانشگاه فردوسی مشهد, دانشیار, ایران, دانشگاه فردوسی مشهد, دانشیار, ایران
پست الکترونیکی naghib@yahoo.com
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved