>
Fa   |   Ar   |   En
   پیش‌بینی تاخیر قطارهای مسافری با استفاده از تکنیک‌های داده‌کاوی  
   
نویسنده یقینی مسعود ,زارعی حامد
منبع مهندسي حمل و نقل - 1400 - دوره : 13 - شماره : 1 - صفحه:1135 -1148
چکیده    هدف از این مقاله، پیش‌بینی تاخیرات قطارهای مسافری در راه‌آهن جمهوری اسلامی ایران با استفاده از تکنیک‌های داده‌کاوی است. پیش‌بینی تاخیرات می‌تواند برای تعیین زمان‌های حائل در جداول زمانی قطارهای مسافری مورد استفاده قرار گیرد. داده‌های مورد استفاده در این مطالعه شامل پایگاه داده تاخیر قطارهای مسافری از سال‌ 92 تا 97 است که دربردارنده 380.748 رکورد  می‌باشد. متغیرهای مستقل جهت پیش‌بینی شامل سال، ماه، روز ماه، روز هفته‌، ساعت حرکت، محورهای حرکت، نوع قطار، نوع سالن، مبدا و مقصد قطار و همچنین نام مالک قطار هستند. مدلسازی پیش‌بینی به دو صورت عددی و طبقه‌ای انجام شده است. جهت پیش‌بینی طبقه‌ای، داده‌های تاخیر با استفاده از روش‌ خوشه‌بندی دو مرحله‌ای گسسته‌سازی شده‌اند. از دو روش شبکه عصبی و c5.0 جهت پیش‌بینی طبقه‌ای و سه روش رگرسیون، chaid و شبکه عصبی برای پیش‌بینی عددی استفاده شده است. برای ارزیابی نتایج پیش‌بینی، مدل ساخته شده ابتدا بر اساس داده‌های سال‌های 92 تا 95 آموزش می‌بیند، سپس به پیش‌بینی تاخیر برای سال 96 می‌پردازد. نتایج نشان می‌دهد که در پیش بینی عددی، روش شبکه عصبی و در پیش‌بینی به صورت طبقه‌ای، روش c5.0 از دقت بالاتری نسبت به سایر روش‌ها برخوردار هستند، لذا از این دو تکنیک برای پیش‌بینی تاخیر قطارهای سال 97 استفاده شده است. همچنین جهت ارزیابی تکرارپذیری نتایج، تاخیرات پیش بینی شده سال 97 با سال 96 مقایسه گردیده اند.  در انتها، پیش‌بینی عددی به صورت گروه‌بندی بر روی رکورد‌های پایگاه داده نیز انجام شده است. نتایج نشان می‌دهد که دقت پیش‌بینی به صورت گروه‌بندی، بالاتر است.
کلیدواژه پیش‌بینی، تاخیر قطارهای مسافری، تکنیک‌های داده‌کاوی، راه‌آهن ایران
آدرس دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی راه آهن, گروه مهندسی حمل و نقل ریلی, ایران
 
   Passenger Train Delay Prediction using Data Mining techniques  
   
Authors Zarei Hamed
Abstract    The aim of this paper is to predict passenger train delays in Iranian Railways using data mining techniques. The results of this research are used to design train timetables. The data used in this research includes a database of passenger train delays from year 2013 to 2018, including 380,748 records. Independent variables for prediction model include year, month, day, day of the week, departure time, axis, train type, car type, origin and destination of the train and the train owner.  In order to model prediction of train delay, two kind of prediction, named Numerical and Classification are used on entire database. Neural network and C5.0 methods are used for classification prediction. The Twostep clustering method is used to divide the delay field into three labels. Regression, CHAID and neural network methods are used for numerical prediction. To evaluate prediction results, we divide existing data set into two subsets called training set and test set, in which delays from year 2013 to 2016 are the training set and delays of year 2017 are the test set. By evaluating the prediction methods, the results show that in numerical prediction, neural network method and in prediction by classification, C5.0 method has higher accuracy than other methods. Therefore, these two techniques have been used to predict the train delays of year 2018. Numerical prediction is used by grouping some database fields. The results show that the prediction by grouping has higher accuracy than the prediction on the entire database.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved