طراحی سازوکار تدارکات براساس یادگیری q و با سیاست انتخاب عمل مبتنی بر الگوریتم ازدحام ذرات
|
|
|
|
|
نویسنده
|
کاهه زهره ,برادران کاظم زاده رضا
|
منبع
|
مديريت زنجيره تامين - 1395 - دوره : 18 - شماره : 51 - صفحه:40 -48
|
چکیده
|
در این مقاله، مسئله مناقصه در یک شرکت خودروسازی برای تدارک قطعات مورد نیاز از تامینکنندگان بالقوه از طریق الگوریتم یادگیری q حل شدهاست. در این مسئله، خریدار با توجه به پیشنهادات دریافتی از تامینکنندگان بالقوه که شامل قیمت و زمان تحویل پیشنهادی است، سفارش قطعات مورد نیاز خود را به تامینکنندگان تخصیص میدهد. هدف خریدار کمینهسازی هزینههای تدارکات از طریق یادگیری از مناقصات پیشین است. این مسئله به صورت یک مسئله تصمیمگیری مارکوفی تعریف شده است که در آن هر عمل وابسته به عمل و وضعیت قبلی است. برای حل این مسئله یک الگوریتم یادگیری تقویتی به نام الگوریتم یادگیری q توسعه داده شده است که در آن از الگوریتم بهینه سازی ازدحام ذرات به عنوان راهکاری برای یافتن و انتخاب سیاست بهینه برای انتخاب عمل در الگوریتم یادگیری q استفاده شدهاست. در مقایسه این الگوریتم با حالتی که در آن سیاست انتخاب عمل مطابق با یک الگوریتم حریصانه است، این الگوریتم بسیار کارآمدتر است.
|
کلیدواژه
|
تدارکات، یادگیری تقویتی، الگوریتم یادگیری q، سیاست انتخاب عمل
|
آدرس
|
دانشگاه تربیت مدرس, ایران, دانشگاه تربیت مدرس, ایران
|
|
|
|
|
|
|