ارائه روشی جدید برای کسب مهارت در یادگیری تقویتی با کمک خوشهبندی گراف
|
|
|
|
|
نویسنده
|
داودآبادی فراهانی مرضیه ,مزینی ناصر
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1397 - دوره : 16 - شماره : 2 - صفحه:131 -141
|
چکیده
|
یادگیری تقویتی، یکی از انواع یادگیری ماشین است که در آن عامل با استفاده از تراکنش با محیط، به شناخت محیط و بهبود رفتار خود میپردازد. یکی از مشکلات اصلی الگوریتمهای استاندارد یادگیری تقویتی مانند یادگیری q این است که نمیتوانند مسایل بزرگ را در زمان قابل قبولی حل کنند. کسب خودکار مهارتها میتواند به شکستن مساله به زیرمسالههای کوچکتر و حل سلسلهمراتبی آن کمک کند. با وجود نتایج امیدوارکننده استفاده از مهارتها در یادگیری تقویتی سلسلهمراتبی، در برخی تحقیقات دیگر نشان داده شد که بر اساس وظیفه مورد نظر، اثر مهارتها بر کارایی یادگیری میتواند کاملاً مثبت یا منفی باشد و اگر به درستی انتخاب نشوند میتوانند پیچیدگی حل مساله را افزایش دهند. از این رو یکی از نقاط ضعف روشهای قبلی کسب خودکار مهارتها، عدم ارزیابی هر یک از مهارتهای کسبشده میباشد. در این مقاله روشهای جدیدی مبتنی بر خوشهبندی گراف برای استخراج زیرهدفها و کسب مهارتها ارائه میگردد. همچنین معیارهای جدید برای ارزیابی مهارتها مطرح میشود که با کمک آنها، مهارتهای نامناسب برای حل مساله حذف میگردند. استفاده از این روشها در چندین محیط آزمایشگاهی افزایش سرعت یادگیری را به شکل قابل ملاحظهای نشان میدهد.
|
کلیدواژه
|
یادگیری تقویتی سلسلهمراتبی، گزینه، انتزاع زمانی، مهارت، ارزیابی مهارتها، خوشهبندی گراف
|
آدرس
|
دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
mozayani@iust.ac.ir
|
|
|
|
|