|
|
تقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی
|
|
|
|
|
نویسنده
|
درهمی ولی ,محرابی امید
|
منبع
|
كنترل - 1390 - دوره : 5 - شماره : 1 - صفحه:50 -63
|
|
|
کلیدواژه
|
یادگیری تقویتی عصبی ,معماری نقاد-تنها ,شبکه عصبی RBF ,یادگیری سارسا ,نقاط ایستا
|
آدرس
|
دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
omidmehrabi62@yahoo.com
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|