>
Fa   |   Ar   |   En
   رویکرد یادگیری تقویتی برای زمان ‏بندی جریان کارگاهی ترکیبی در فولادسازی  
   
نویسنده مهدی نیا بهنام ,ملاوردی ناصر
منبع بيست و ششمين سمپوزيوم ملي فولاد 403 - 1403 - دوره : 26 - بیست و ششمین سمپوزیوم ملی فولاد 403 - کد همایش: 03240-80486 - صفحه:0 -0
چکیده    این مطالعه با استفاده از رویکرد یادگیری تقویتی، به مسئله زمان‏بندی جریان کارگاهی ترکیبی در فولادسازی می‌پردازد. کارخانه فولادسازی فرضی در نظر گرفته شده، شامل 4 کوره قوس الکتریکی، 3 کوره پاتیلی و 3 ماشین ریخته‏ گری پیوسته است. مساله با روش یادگیری q با شبکه ‏های عصبی عمیق حل شده است. برای پیاده ‏سازی این روش، نمایش وضعیت از زمان‏ های آماده به کاری ماشین‌ها، زمان‏ های پردازش کارها، عمر تاندیش و برنامه‏ های نگهداری و تعمیرات، تشکیل شده است. تابع پاداش نیز، تصمیمات را با توجه به معیارهای زمان‏ های انتظار، قطع ریخته‏ گری مداوم، عادلانه بودن استفاده از ماشین‌ها و زمان‏ های جابجایی، مورد نقد قرار می‏دهد. همچنین، یک محیط شبیه‏ سازی با زبان برنامه نویسی پایتون برای کارخانه فرضی ایجاد شده که به عامل فرصت تعامل با محیط کارخانه فولادسازی و کسب تجربه در شرایط تصادفی مختلف را می‏دهد. پس از 500000 فریم آموزشی، عامل به دقت 99.4 درصدی در آزمایش بر روی 1000 نمونه مسئله تصادفی دست یافت که عملکردی تقریباً بهینه را نشان می‌دهد. این مطالعه پتانسیل‌های یادگیری تقویتی را در بهینه‌سازی فرایندهای پیچیده صنعتی برجسته می‌کند.
کلیدواژه یادگیری تقویتی، یادگیری q، شبکه عصبی عمیق، زمان‏ بندی جریان کارگاهی ترکیبی.
آدرس , iran, , iran
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved