|
|
کاربرد یادگیری عمیق در دینامیک سنجش ریسک مشروط و آربیتراژ آماری
|
|
|
|
|
نویسنده
|
نعمتی زهرا ,صلواتی عرفان
|
منبع
|
هشتمين همايش ملي رياضيات و علوم انساني - 1403 - دوره : 8 - هشتمین همایش ملی ریاضیات و علوم انسانی - کد همایش: 03240-22097 - صفحه:0 -0
|
چکیده
|
در این مقاله، راهکاری نوین برای چالش های مدیریت ریسک در یادگیری تقویتی معرفی میشود. هدف عامل در این رویکرد، بهینه سازی دینامیک اندازه ریسک طیفی پیوسته در طول زمان است. این روش با استفاده از مفهوم استخراج پذیری مشروط، توابع امتیازدهی را ایجاد کرده که به طور موثری انحراف معیار را در فرآیند تخمین، جریمه میکنند. این پایان نامه را میتوان در سه محور اصلی خلاصه کرد: نخست، یک راهکار کارآمد برای تخمین دسته ای از دینامیک سنجه ریسک طیفی با بهره گیری از شبکه های عصبی عمیق پیشنهاد میشود. دوم، نشان داده میشود که این سنجه ها را می توان با دقت دلخواه با استفاده از شبکه های عصبی عمیق تقریب زد. در نهایت، الگوریتمی برای عامل مخالف حساس به ریسک طراحی میشود که نیاز به انتقال های تودرتوی اضافی را برطرف میسازد. برای ارزیابی عملکرد این الگوریتم یادگیری تقویتی، کارایی آن با استفاده از رویکرد شبیه سازی تودرتو در سناریوی آربیتراژ آماری نشان داده میشود.
|
کلیدواژه
|
یادگیری تقویتی، توابع امتیازدهی ثابت، مدل سنجه ریسک، الگوریتم عامل مخالف.
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|