|
|
بهبود عملکرد حمله در تیم رباتهای فوتبالیست با استفاده از یادگیری تقویتی
|
|
|
|
|
نویسنده
|
خاکسار مینا ,درهمی ولی ,رضائیان مهدی
|
منبع
|
مهندسي برق دانشگاه تبريز - 1397 - دوره : 48 - شماره : 2 - صفحه:585 -594
|
چکیده
|
بهدلیل عدم امکان پیشبینی همه وضعیتهای ممکن برای عاملها در یک سیستم چندعاملهی پویا و گسترده، روشهای یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عاملها میباشد. فوتبال شبیهسازی شده رباتها یک مسئله شناختهشده برای ارزیابی الگوریتمهای یادگیری ماشین روی سیستمهای چندعامله است. در این مقاله الگوریتم یادگیری کیو وی (یکی از الگوریتمهای معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رباتهای فوتبالیست دو بعدی بکار گرفته شدهاست. سیگنال تقویتی براساس اینکه بازیکنانی که در حمله دخالت دارند، توپ را جلوی دروازه میرسانند، یا اینکه توپ را از دست میدهند، تعریف شدهاست و بهترتیب عاملها با توجه به وضعیت ذکرشده، جایزه و جریمه دریافت میکنند. جهت بهبود عملکرد از ایده تقسیم سیگنال تقویتی متناسب با مقدار خبرگی عاملها در یک سیستم چندعامله استفاده شدهاست. در اینجا میزان خبرگی متناسب با تفاوت ارزش عملِ با بالاترین ارزش با ارزشِ عملِ با کمترین مقدار ارزش در هر حالت تعریف میشود. نتایج شبیهسازی نشان میدهد، بهرهگیری از ایده تقسیم سیگنال تقویتی براساس خبرگی در آموزش باعث افزایش سرعت در آموزش و بهبود عملکرد عاملها شدهاست.
|
کلیدواژه
|
فوتبال شبیهسازیشده رباتها، یادگیری تقویتی، یادگیری کیو وی، سیستمهای چندعامله، حمله
|
آدرس
|
دانشگاه یزد, گروه مهندسی کامپیوتر, ایران, دانشگاه یزد, گروه مهندسی کامپیوتر, ایران, دانشگاه یزد, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
mrezaeian@yazd.ac.ir
|
|
|
|
|
|
|
|
|
Improve Performance of Attack in the Team Robots Soccer using Reinforcement Learning
|
|
|
Authors
|
Khaksar M. ,Derhami V. ,Rezaeian M.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|