پیش‌بینی زمان سفر با یادگیری ماشین: رقابت رگرسیون خطی، رگرسیون چند متغیره، جنگل تصادفی و شبکه عصبی عمیق

Fa | Ar | En

پیش‌بینی زمان سفر با یادگیری ماشین: رقابت رگرسیون خطی، رگرسیون چند متغیره، جنگل تصادفی و شبکه عصبی عمیق


نویسنده	رضائی زهرا ,آقامحمدی حسین ,وحیدنیا محمدحسن ,عزیزی زهرا ,بهزادی سعید
منبع	علوم و فنون نقشه برداري - 1403 - دوره : 14 - شماره : 2 - صفحه:1 -18
چکیده	پیش‌بینی دقیق زمان‌سفر یکی از مسائل مهم در حوزه ترافیک و حمل‌و‌نقل است که می‌تواند به طور قابل توجهی بر زندگی روزمره افراد و سازمان‌ها تاثیر بگذارد. در این پژوهش، چهار روش مختلف یادگیری ماشین شامل رگرسیون خطی (lr)، رگرسیون چندمتغیره (mr)، رگرسیون جنگل تصادفی (rdr) و شبکه عصبی مصنوعی عمیق (dnn) برای پیش‌بینی زمان‌سفر آموزش داده شدند. هدف از این پژوهش پیش بینی زمان‌سفر جهت استفاده در سیستم‌ های ترافیک هوشمند است و بهره‌ گیری و مقایسه چندین روش جدید شامل شبکه عصبی عمیق و رگرسیون جنگل تصادفی و همچنین دخیل نمودن پارامترهای جدید مانند وضعیت بارش، نرم جریان ترافیک، زمان و همچنین تصادفات و نقاط قفل ترافیکی نسبت به پژوهش‌ های دیگر، نوآوری و جامعیت این پژوهش نسبت با سایر مطالعات می‌باشد. در طراحی و اجرای این پژوهش از داده‌های واقعی ترافیک برگرفته از google map استفاده و آنالیز گردید. این داده‌ ها شامل اطلاعاتی از جمله شرایط ترافیک، فصل سال، ساعت روز، وضعیت بارش جوی و ویژگی‌های مسیر می‌باشد. نتایج این پژوهش نشان می‌دهد که مدل dnn با r2 برابر با 0.833 عملکرد خیلی خوبی را در بین مدل‌های مورد بررسی دارد. این مدل 0.833% واریانس داده‌ها را توضیح می‌دهد و توزیع باقیمانده‌ها در آن به طور نسبی مرکزی با میانگین صفر و توزیعی نزدیک به نرمال است. مدل رگرسیون خطی با r2 برابر با 0.615 عملکرد ضعیف‌تری نسبت به dnn دارد و 0.615% از واریانس داده‌ها را توضیح می‌دهد. و اما مدل رگرسیون جنگل تصادفی با r^2 برابر با 0.955 در رقابت با dnn یکی از بهترین عملکردها را دارد و 0.955% از واریانس داده‌ها را توضیح می‌دهد. پارامترهای mse و rmse نیز جهت ارزیابی عملکرد مدل‌ ها استفاده شدند و نهایتا مقایسه چندبعدی بین مدل ‌ها صورت گرفت و مدل جنگل تصادفی کمترین مقادیر خطا را نتیجه داد. از آنجائی‌که در داده‌ های ترافیکی جمع‌ آوری شده، حوادث رانندگی و تبعا نقاط قفل ترافیکی در مدل‌ها نیز استفاده شده، و با لحاظ اینکه مدل رگرسیون جنگل تصادفی با وجود نویز و آنومالی نیز به طور موثرتری با داده‌ها تطبیق یافته می‌ یابند، مقدار r2 این مدل، از شبکه ‌های عصبی عمیق بدلیل داشتن ذات بیش‌ پردازشی، بالاتر حاصل شده ‌است.
کلیدواژه	زمان سفر، رگرسیون خطی، رگرسیون چند متغیره، جنگل تصادفی، یادگیری عمیق، شبکه عصبی عمیق
آدرس	دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, ایران, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, گروه سنجش از دور و سیستم اطلاعات جغرافیایی, ایران, دانشگاه شهید بهشتی, مرکز مطالعات سنجش از دور و gis، دانشکده علوم زمین, ایران, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, گروه سنجش از دور و سیستم اطلاعات جغرافیایی, ایران, دانشگاه تربیت معلم شهید رجایی, دانشکده مهندسی عمران, گروه مهندسی نقشه برداری, ایران
پست الکترونیکی	behzadi@sru.ac.ir

travel time prediction with machine learning: competition of linear regression, multivariate regression, random forest and deep neural network

Authors	rezaee zahra ,aghamohammadi hossein ,vahidnia mohammad h ,azizi zahra ,behzadi saeed
Abstract	accurate travel time prediction is one of the important issues in the field of traffic and transportation that can significantly affect the daily life of people and organizations. in this research, four different machine learning methods including linear regression, multivariate regression, random forest and deep artificial neural network were trained to predict travel time. the purpose of this research is to predict travel time for use in intelligent traffic systems and to use and compare several new methods, including deep neural network and random forest regression, as well as considering new parameters in the computations such as weather conditions, traffic flow, travel time, and accidents and the traffic locking points compared to other studies are the innovation and comprehensiveness of this study compared to other studies. in the design and implementation of this research, real traffic data taken from google map was used and analyzed. this data includes information such as traffic conditions, season, time of day, weather conditions, and route characteristics. the results of this research show that the deep neural network (dnn) model with r2 equal to 0.833 has a very good performance among the investigated models. this model explains 0.833% of the variance of the data and the distribution of the residuals in it is relatively central with a mean of zero and a distribution close to normal. the linear regression model with r2 equal to 0.615 has a poorer performance than dnn and explains 0.615% of the data variance. but the random regression model with r2 equal to 0.955 has one of the best performances in competition with dnn and explains 0.955% of the data variance. mse and rmse parameters were also used to evaluate the performance of the models, and as a result, a multidimensional comparison was made between the models, and the random forest model resulted in the lowest error values. since in the collected traffic data, traffic accidents and consequently traffic locking points are also used in the models, and considering that the random forest model is more effectively adapted to the data despite the presence of noise and anomaly, the r2 value of this model is higher than r2 of deep neural networks, due to the overfitting nature of deep learning methods.
Keywords	travel time ,linear regression ,multivariate regression ,random forest ,deep learning