|
|
توسعه الگوریتم یادگیری تقویتی عمیق در سیستم تولید سلولی پویا با در نظر گرفتن رد سفارشات، مطالعه موردی: کارخانه کاغذ سنگی
|
|
|
|
|
نویسنده
|
جعفری مصطفی ,اکبری امیر حسین
|
منبع
|
مديريت مهندسي و رايانش نرم - 1403 - دوره : 10 - شماره : 2 - صفحه:204 -222
|
چکیده
|
در این تحقیق، یک الگوریتم یادگیری تقویتی عمیق برای مسئله سیستم تولید سلولی با در نظر گرفتن هزینههای تاخیر و رد سفارشات پیشنهاد شده است. سفارشات با ویژگیهای مختلف شامل درآمد، زمان انجام، موعد تحویل و هزینه تاخیر به صورت پویا و در زمانهای مختلف وارد سیستم میشوند. با توجه به ظرفیت محدود سیستم، امکان پذیرش تمامی سفارشات وجود ندارد و برخی از آنها باید در زمان ورود رد شوند تا امکان انجام بهموقع سایر سفارشات فراهم شود. یک مدل ریاضی با دو هدف بیشینهسازی سود و کمینهسازی تعداد سفارشات ردشده ارائه شده است و برای حل این مسئله، از یک الگوریتم یادگیری تقویتی عمیق استفاده شده است. الگوریتم پیشنهادی در دستههای مختلفی از مسائل نمونهای و مسائل واقعی با الگوریتمهای موجود در ادبیات مقایسه شده و کارایی آن به اثبات رسیده است. نتایج نشاندهنده برتری 36.3 درصدی در سود و 13.87 درصدی در تعداد سفارشات پذیرفتهشده است. همچنین، با پذیرش 1 درصد سفارش بیشتر، میزان سود بهطور متوسط 2.7 درصد کاهش مییابد.
|
کلیدواژه
|
یادگیری تقویتی عمیق، سیستم تولیدی سلولی، پذیرش و زمان بندی سفارشات، الگوریتم ژنتیک
|
آدرس
|
دانشگاه علم و صنعت, دانشکده مهندسی صنایع, ایران, دانشگاه علم و صنعت, دانشکده مهندسی صنایع, ایران
|
پست الکترونیکی
|
akbari@qut.ac.ir
|
|
|
|
|
|
|
|
|
development of a deep reinforcement learning algorithm in a dynamic cellular manufacturing system considering order rejection, case study: stone paper factory
|
|
|
Authors
|
jafari mostafa ,akbari amir hossein
|
Abstract
|
in this research, a deep reinforcement learning algorithm is proposed for the cellular manufacturing system problem considering the costs of delay and rejection of orders. orders with different characteristics including revenue, lead time, delivery date, and delay cost are dynamically entered into the system at different times. due to the limited capacity of the system, it is not possible to accept all orders and some of them must be rejected at the time of entry to enable timely execution of other orders. a mathematical model with two objectives of maximizing profit and minimizing the number of rejected orders is presented and a deep reinforcement learning algorithm is used to solve this problem. the proposed algorithm is compared with the algorithms available in the literature in different categories of example problems and real problems and its efficiency is proven. the results show a 36.3% advantage in profit and 13.87% in the number of accepted orders. also, by accepting 1% more orders, the profit decreases by 2.7% on average
|
Keywords
|
deep reinforcement learning ,cellular manufacturing system ,order acceptance and scheduling ,genetic algorithm
|
|
|
|
|
|
|
|
|
|
|