>
Fa   |   Ar   |   En
   توسعه الگوریتم یادگیری تقویتی عمیق در سیستم تولید سلولی پویا با در نظر گرفتن رد سفارشات، مطالعه موردی: کارخانه کاغذ سنگی  
   
نویسنده جعفری مصطفی ,اکبری امیر حسین
منبع مديريت مهندسي و رايانش نرم - 1403 - دوره : 10 - شماره : 2 - صفحه:204 -222
چکیده    در این تحقیق، یک الگوریتم یادگیری تقویتی عمیق برای مسئله سیستم تولید سلولی با در نظر گرفتن هزینه‌های تاخیر و رد سفارشات پیشنهاد شده است. سفارشات با ویژگی‌های مختلف شامل درآمد، زمان انجام، موعد تحویل و هزینه تاخیر به صورت پویا و در زمان‌های مختلف وارد سیستم می‌شوند. با توجه به ظرفیت محدود سیستم، امکان پذیرش تمامی سفارشات وجود ندارد و برخی از آنها باید در زمان ورود رد شوند تا امکان انجام به‌موقع سایر سفارشات فراهم شود. یک مدل ریاضی با دو هدف بیشینه‌سازی سود و کمینه‌سازی تعداد سفارشات ردشده ارائه شده است و برای حل این مسئله، از یک الگوریتم یادگیری تقویتی عمیق استفاده شده است. الگوریتم پیشنهادی در دسته‌های مختلفی از مسائل نمونه‌ای و مسائل واقعی با الگوریتم‌های موجود در ادبیات مقایسه شده و کارایی آن به اثبات رسیده است. نتایج نشان‌دهنده برتری 36.3 درصدی در سود و 13.87 درصدی در تعداد سفارشات پذیرفته‌شده است. همچنین، با پذیرش 1 درصد سفارش بیشتر، میزان سود به‌طور متوسط 2.7 درصد کاهش می‌یابد.
کلیدواژه یادگیری تقویتی عمیق، سیستم تولیدی سلولی، پذیرش و زمان بندی سفارشات، الگوریتم ژنتیک
آدرس دانشگاه علم و صنعت, دانشکده مهندسی صنایع, ایران, دانشگاه علم و صنعت, دانشکده مهندسی صنایع, ایران
پست الکترونیکی akbari@qut.ac.ir
 
   development of a deep reinforcement learning algorithm in a dynamic cellular manufacturing system considering order rejection, case study: stone paper factory  
   
Authors jafari mostafa ,akbari amir hossein
Abstract    in this research, a deep reinforcement learning algorithm is proposed for the cellular manufacturing system problem considering the costs of delay and rejection of orders. orders with different characteristics including revenue, lead time, delivery date, and delay cost are dynamically entered into the system at different times. due to the limited capacity of the system, it is not possible to accept all orders and some of them must be rejected at the time of entry to enable timely execution of other orders. a mathematical model with two objectives of maximizing profit and minimizing the number of rejected orders is presented and a deep reinforcement learning algorithm is used to solve this problem. the proposed algorithm is compared with the algorithms available in the literature in different categories of example problems and real problems and its efficiency is proven. the results show a 36.3% advantage in profit and 13.87% in the number of accepted orders. also, by accepting 1% more orders, the profit decreases by 2.7% on average
Keywords deep reinforcement learning ,cellular manufacturing system ,order acceptance and scheduling ,genetic algorithm
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved