یک الگوریتم تکراری برای حل مسایل کنترل بهینه تصادفی با استفاده از زنجیر مارکوف

Fa | Ar | En

یک الگوریتم تکراری برای حل مسایل کنترل بهینه تصادفی با استفاده از زنجیر مارکوف


نویسنده	کفاش بهزاد ,نیکویی نژاد زهرا ,دلاورخلفی علی
منبع	كنترل - 1395 - دوره : 10 - شماره : 2 - صفحه:35 -43
چکیده	در این مقاله، یک روش عددی برای حل مساله کنترل بهینه تصادفی با استفاده از زنجیرهای مارکوف ارائه شدهاست. بدین ترتیب که، ابتدا فرایند پخش کنترلی وضعیت سیستم با استفاده از یک زنجیر مارکوف کنترلی روی یک فضای وضعیت متناهی تقریب زده میشود. سپس تقریبی از تابع هزینه اولیه با استفاده از این زنجیر مارکوف تقریبی، بهدست میآید. برای اثبات همگرایی روش و یافتن یک زنجیر مارکوف تقریبی مناسب برای فرایند پخش، باید دو معیار مورد بررسی قرار گیرد. به عبارتی باید امید ریاضی و کوواریانس شرطی تغییرات وضعیت زنجیر مارکوف با میانگین و کوواریانس موضعی فرایند پخش اولیه متناسب باشند. با استفاده از تقریبات تفاضلات متناهی میتوان احتمالات انتقال و بازههای زمانی تغییر وضعیت زنجیر مارکوف را به گونهای تعیین کرد که زنجیر مارکوف در دو ویژگی سازگاری موضعی فوق صدق کند. در ادامه معادله برنامهریزی پویا با زنجیر مارکوفی که بدین ترتیب بهدست آمده و دارای این ویژگیهای میباشد، تقریب زده میشود. نهایتاً، با میل دادن پارامتر گسسته سازی زنجیر مارکوف به صفر، مشاهده میشود که جواب مسئله کنترل تصادفی تقریبی زنجیر مارکوف، به جواب مسئله کنترل بهینه تصادفی اولیه همگرا میباشد. در پایان یک الگوریتم تکراری برای حل مساله کنترل بهینه تصادفی پیشنهاد شده و از آن برای حل یک مثال استفاده شده است.
کلیدواژه	مساله کنترل بهینه تصادفی، زنجیر مارکوف، روش عددی، الگوریتم تکراری.
آدرس	دانشگاه اردکان, ایران, دانشگاه یزد, ایران, دانشگاه یزد, ایران
پست الکترونیکی	delavarkh@yazd.ac.ir

An iterative algorithm for solving stochastic optimal control via the Markov chain approximation

Authors	Kafash Behzad ,Nikoeenezhad Zahra ,Delavarkhalafi Ali