|
|
پیشبینی تاخیر قطارهای مسافری با استفاده از تکنیکهای دادهکاوی
|
|
|
|
|
نویسنده
|
یقینی مسعود ,زارعی حامد
|
منبع
|
مهندسي حمل و نقل - 1400 - دوره : 13 - شماره : 1 - صفحه:1135 -1148
|
چکیده
|
هدف از این مقاله، پیشبینی تاخیرات قطارهای مسافری در راهآهن جمهوری اسلامی ایران با استفاده از تکنیکهای دادهکاوی است. پیشبینی تاخیرات میتواند برای تعیین زمانهای حائل در جداول زمانی قطارهای مسافری مورد استفاده قرار گیرد. دادههای مورد استفاده در این مطالعه شامل پایگاه داده تاخیر قطارهای مسافری از سال 92 تا 97 است که دربردارنده 380.748 رکورد میباشد. متغیرهای مستقل جهت پیشبینی شامل سال، ماه، روز ماه، روز هفته، ساعت حرکت، محورهای حرکت، نوع قطار، نوع سالن، مبدا و مقصد قطار و همچنین نام مالک قطار هستند. مدلسازی پیشبینی به دو صورت عددی و طبقهای انجام شده است. جهت پیشبینی طبقهای، دادههای تاخیر با استفاده از روش خوشهبندی دو مرحلهای گسستهسازی شدهاند. از دو روش شبکه عصبی و c5.0 جهت پیشبینی طبقهای و سه روش رگرسیون، chaid و شبکه عصبی برای پیشبینی عددی استفاده شده است. برای ارزیابی نتایج پیشبینی، مدل ساخته شده ابتدا بر اساس دادههای سالهای 92 تا 95 آموزش میبیند، سپس به پیشبینی تاخیر برای سال 96 میپردازد. نتایج نشان میدهد که در پیش بینی عددی، روش شبکه عصبی و در پیشبینی به صورت طبقهای، روش c5.0 از دقت بالاتری نسبت به سایر روشها برخوردار هستند، لذا از این دو تکنیک برای پیشبینی تاخیر قطارهای سال 97 استفاده شده است. همچنین جهت ارزیابی تکرارپذیری نتایج، تاخیرات پیش بینی شده سال 97 با سال 96 مقایسه گردیده اند. در انتها، پیشبینی عددی به صورت گروهبندی بر روی رکوردهای پایگاه داده نیز انجام شده است. نتایج نشان میدهد که دقت پیشبینی به صورت گروهبندی، بالاتر است.
|
کلیدواژه
|
پیشبینی، تاخیر قطارهای مسافری، تکنیکهای دادهکاوی، راهآهن ایران
|
آدرس
|
دانشگاه علم و صنعت ایران, ایران, دانشگاه علم و صنعت ایران, دانشکده مهندسی راه آهن, گروه مهندسی حمل و نقل ریلی, ایران
|
|
|
|
|
|
|
|
|
|
|
Passenger Train Delay Prediction using Data Mining techniques
|
|
|
Authors
|
Zarei Hamed
|
Abstract
|
The aim of this paper is to predict passenger train delays in Iranian Railways using data mining techniques. The results of this research are used to design train timetables. The data used in this research includes a database of passenger train delays from year 2013 to 2018, including 380,748 records. Independent variables for prediction model include year, month, day, day of the week, departure time, axis, train type, car type, origin and destination of the train and the train owner. In order to model prediction of train delay, two kind of prediction, named Numerical and Classification are used on entire database. Neural network and C5.0 methods are used for classification prediction. The Twostep clustering method is used to divide the delay field into three labels. Regression, CHAID and neural network methods are used for numerical prediction. To evaluate prediction results, we divide existing data set into two subsets called training set and test set, in which delays from year 2013 to 2016 are the training set and delays of year 2017 are the test set. By evaluating the prediction methods, the results show that in numerical prediction, neural network method and in prediction by classification, C5.0 method has higher accuracy than other methods. Therefore, these two techniques have been used to predict the train delays of year 2018. Numerical prediction is used by grouping some database fields. The results show that the prediction by grouping has higher accuracy than the prediction on the entire database.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|