|
|
ارزیابی عملکرد روشهای مختلف یادگیری ماشین در شناسایی نوع حمل و نقل با استفاده از دادههای خط سیر
|
|
|
|
|
نویسنده
|
طیبی مرتضی ,پهلوانی پرهام
|
منبع
|
مهندسي فناوري اطلاعات مكاني - 1401 - دوره : 10 - شماره : 3 - صفحه:71 -94
|
چکیده
|
با ظهور گسترده گوشیهای هوشمند که به سامانه موقعیتیاب جهانی (gps) مجهز هستند، حجم انبوهی از دادههای مکانی خط سیر کاربران ایجاد شده است. مطالعه بر روی این دادهها در راستای تسهیل مدیریت شهری و ارائه مناسب خدمات به کاربران بهعنوان یک زمینه تحقیقاتی گسترده مطرح شده و در حال رشد است. در این تحقیق به شناسایی نوع حملونقل خطوط سیر کاربران بر مبنای دادههای خام gps آنها پرداخته شده است. این دادهها غالباً دارای خطاهایی هستند که در این تحقیق با اعمال یک فرآیند پیشپردازش چندمرحلهای سعی شده است مقدار خطا به حداقل برسد. سپس بهمنظور شناسایی نوع حملونقل شامل پیادهروی، دوچرخه، قطار، اتوبوس و رانندگی ویژگیهای متعددی استخراج میشود. در ادامه بهمنظور ساختن مدل پیشبینی کننده از چهار روش طبقهبندی درخت تصمیم، شبکه عصبی پرسپترون چندلایه، بیز ساده و ماشین بردار پشتیبان استفاده میشود. در جهت بهبود عملکرد روشهای پیادهسازی، از درصد حضور نقاط هر خط سیر در فاصله یک انحراف معیار از میانگین کل سرعت نوعهای حملونقل به عنوان یک ویژگی جدید استفاده شده است. پیادهسازی چهار مدل یادشده به ازای پارامترهای تنظیمکننده مختلف انجام شده و پس از یک جستجوی جامع شبکهای پارامترهای مختلف موجود در این روشها در بهینهترین مقدار تنظیم میشوند. در ادامه از سه شاخص کاپا، دقت کلی و خطای جذر میانگین مربعات (rmse) برای ارزیابی روشهای مختلف استفاده میشود. نتایج حاصل از این تحقیق نشان داد که شبکه عصبی پرسپترون چندلایه با دقت کلی 0.88 توانست بهترین نتایج را نسبت به سایر مدلها از خود نشان دهد.
|
کلیدواژه
|
دادههای خط سیر، تعیین نوع حملونقل، طبقهبندی، یادگیری ماشین
|
آدرس
|
دانشگاه تهران، دانشکدگان فنی, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, ایران, دانشگاه تهران، دانشکدگان فنی, دانشکده مهندسی نقشه برداری و اطلاعات مکانی, ایران
|
پست الکترونیکی
|
pahlavani@ut.ac.ir
|
|
|
|
|
|
|
|
|
analyzing the performance of different machine learning methods in determining the transportation mode using trajectory data
|
|
|
Authors
|
tayebi morteza ,pahlavani parham
|
Abstract
|
with the widespread advent of the smart phones equipping with global positioning system (gps), a huge volume of users’ trajectory data was generated. to facilitate the urban management and present appropriate services to users, studying these data was raised as a widespread research field and has been developing since then. in this research, the transportation mode of users’ trajectories was identified based on their raw gps data. these data are often associated with errors, it was attempted to minimize them by applying a comprehensive pre-processing procedure in this research. accordingly, various features were extracted to identify the transportation modes including walk, bike, train, bus, and driving. in this regard, four classification methods including decision tree, multilayer perceptron neural network, naïve bayes, and support vector machine were used to build a predictive model. in order to improve the performance of the implementation methods, the percentage of the points of each trajectory on the distance of one standard deviation from the total speed average of transportation modes has been used as a new feature. the above-mentioned four models were implemented with different regularization parameters and their values were set to the optimal values by applying a comprehensive grid search. then, kappa and the overall accuracy indices were employed to evaluate different methods. the results of this study show that the multilayer perceptron neural network with overall accuracy of 0.88 has the best results compared to the other models.
|
Keywords
|
trajectory data ,determining the transportation mode ,classification ,machine learning
|
|
|
|
|
|
|
|
|
|
|