|
|
رویکرد یادگیری تقویتی برای زمان بندی جریان کارگاهی ترکیبی در فولادسازی
|
|
|
|
|
نویسنده
|
مهدی نیا بهنام ,ملاوردی ناصر
|
منبع
|
بيست و ششمين سمپوزيوم ملي فولاد 403 - 1403 - دوره : 26 - بیست و ششمین سمپوزیوم ملی فولاد 403 - کد همایش: 03240-80486 - صفحه:0 -0
|
چکیده
|
این مطالعه با استفاده از رویکرد یادگیری تقویتی، به مسئله زمانبندی جریان کارگاهی ترکیبی در فولادسازی میپردازد. کارخانه فولادسازی فرضی در نظر گرفته شده، شامل 4 کوره قوس الکتریکی، 3 کوره پاتیلی و 3 ماشین ریخته گری پیوسته است. مساله با روش یادگیری q با شبکه های عصبی عمیق حل شده است. برای پیاده سازی این روش، نمایش وضعیت از زمان های آماده به کاری ماشینها، زمان های پردازش کارها، عمر تاندیش و برنامه های نگهداری و تعمیرات، تشکیل شده است. تابع پاداش نیز، تصمیمات را با توجه به معیارهای زمان های انتظار، قطع ریخته گری مداوم، عادلانه بودن استفاده از ماشینها و زمان های جابجایی، مورد نقد قرار میدهد. همچنین، یک محیط شبیه سازی با زبان برنامه نویسی پایتون برای کارخانه فرضی ایجاد شده که به عامل فرصت تعامل با محیط کارخانه فولادسازی و کسب تجربه در شرایط تصادفی مختلف را میدهد. پس از 500000 فریم آموزشی، عامل به دقت 99.4 درصدی در آزمایش بر روی 1000 نمونه مسئله تصادفی دست یافت که عملکردی تقریباً بهینه را نشان میدهد. این مطالعه پتانسیلهای یادگیری تقویتی را در بهینهسازی فرایندهای پیچیده صنعتی برجسته میکند.
|
کلیدواژه
|
یادگیری تقویتی، یادگیری q، شبکه عصبی عمیق، زمان بندی جریان کارگاهی ترکیبی.
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|