|
|
کنترل ترافیک یک چهارراه راهنمایی رانندگی با استفاده از الگوریتمهای یادگیری تقویتی (یادگیریq، سارسا و مسیرهای شایستگی)
|
|
|
|
|
نویسنده
|
عربی علیرضا ,نوری امین
|
منبع
|
جاده - 1397 - شماره : 94 - صفحه:55 -68
|
چکیده
|
یکی ازمهمترین اهداف پژوهش درحوزه حمل و نقل،بهینه کردن جریان های ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابع ارائه شده توسط زیرساخت های فعلی و ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از روشهای هوشمند در کنترل ترافیک به خصوص روشهای حل مساله یادگیری تقویتی حائز اهمیت است. روش یادگیری تقویتی علاوه بر سادگی و نداشتن پیچیدگی محاسباتی، در عمل بی نیاز به مدل ریاضی محیط میباشد و خاصیت تطبیق پذیری با شرایط محیط و مقاوم بودن در برابر تغییرات محیطی را دارد. در این مقاله کنترل ترافیک یک تقاطع با سه روش از زیر روشهای حل مساله یادگیری تقویتی (یادگیریq، سارسا و مسیرهای شایستگی) انجام شده است. نتایج شبیهسازی حاکی از آن است که مسیرهای شایستگی یک روش کنترلی بروزتر و بهینهتر نسبت به دو روش یادگیریq و سارسا که پیشتر در مقالات کنترل ترافیک مورد استفاده قرار گرفته است، میباشد.
|
کلیدواژه
|
کنترل سیگنال ترافیک، یادگیری تقویتی، یادگیریq، ساراسا، مسیرهای شایستگی
|
آدرس
|
دانشگاه صنعتی سجاد, دانشکده برق و مهندسی پزشکی, ایران, دانشگاه صنعتی سجاد, دانشکده برق و مهندسی پزشکی, ایران
|
|
|
|
|
|
|
|
|
|
|
Traffic Signal Control of a Crossroad Using Reinforcement Learning Methods (QLearning, Sarsa, Eligibility Traces)
|
|
|
Authors
|
Arabi A.R. ,Noori A
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|