|
|
مقایسهی دقت مدلهای آماری و یادگیری ماشین برای پیشبینی نگهداشت وجه نقد و ارائه مدل بهینه
|
|
|
|
|
نویسنده
|
میرزایی سجاد ,محمدی مهدی ,منصور فر غلامرضا
|
منبع
|
راهبرد مديريت مالي - 1402 - دوره : 11 - شماره : 42 - صفحه:1 -28
|
چکیده
|
پژوهش حاضر، مقایسه دقت مدلهای یادگیری ماشین و آماری در پیشبینی نگهداشت وجه نقد را با استفاده از مجموعه متغیرهای مالی و اقتصادی مورد بررسی قرار داده است. روششناسی پژوهش را میتوان به سه مرحله گزینش مجموعه داده و متغیرها، مدلسازی و قیاس تقسیمبندی کرد. نمونهآماری پژوهش حاضر بورس اوراق بهادار تهران است که دادههای 173 شرکت در طی بازه زمانی 1400-1389 مورد بررسی قرارگرفته است. نتایج حاکی از دقت بالای مدل رگرسیون نمادین با استفاده از الگوریتم ژنتیک با ضریب دقت 71 درصد در این زمینه است. بعدازآن به ترتیب مدلهای تقویت گرادیان درختی، رگرسیون مارس، شبکه عصبی و تقویت گرادیان فوقالعاده بهعنوان دقیقترین مدلها جهت پیشبینی ارزیابی شدند. درنهایت مدل k نزدیکترین همسایه ضعیفترین دقت پیشبینی را از خود نشان داد. همچنین اگرچه مدلهای آماری دقت پیشبینی پایینی را نشان دادند اما بااینحال از برخی مدلهای یادگیری ماشین ضریب دقت بالاتری را کسب کردند. همچنین نتایج نشان داد استفاده از رگرسیون لاسو موجب بهبود دقت مدلهای آماری و برخی از مدلهای یادگیری ماشین میگردد. این پژوهش میتواند زوایای جدیدی از تکنیکهای پیشبینی نگهداشت وجه نقد را در مطالعات مالی بیفزاید که تاکنون در ادبیات مالی مورد بررسی قرار نگرفته است.
|
کلیدواژه
|
رگرسیون لاسو، پیشبینی نگهداشت وجه نقد، یادگیری ماشین
|
آدرس
|
دانشگاه ارومیه, دانشکده اقتصاد و مدیریت, ایران, دانشگاه ارومیه, دانشکده اقتصاد و مدیریت, ایران, دانشگاه ارومیه, دانشکده اقتصاد و مدیریت, گروه حسابداری و مدیریت مالی, ایران
|
پست الکترونیکی
|
g.mansourfar@urmia.ac.ir
|
|
|
|
|
|
|
|
|
comparison of statistical and machine models for predicting cash holdings and providing the optimal model
|
|
|
Authors
|
mirzaei sajjad ,mohammadi mehdi ,mansourfar gholamreza
|
Abstract
|
the current paper has investigated the comparison of the accuracy of machine learning and statistical models in predicting cash holdings using a set of financial and economic variables. research methodology can be divided into three stages: selection of data set and variables, modeling and estimation. the statistical sample of the current research is the tehran stock exchange, where the data of 173 companies have been analyzed during the period of 2010-2021. the results indicate the high accuracy of the symbolic regression model using the genetic algorithm with an accuracy factor of 71% in this field. after that, gradient boosted trees, mars regression, neural network and xgboost models were evaluated as the most accurate models for prediction. finally, the knn model showed the weakest prediction accuracy. also, although the statistical models showed low prediction accuracy, they obtained a higher accuracy coefficient from some machine learning models. also, the results showed that the use of lasso regression improves the accuracy of statistical models and some machine learning models. this research can add new angles of cash retention forecasting techniques in financial studies, which have not been investigated in financial literature so far.
|
|
|
|
|
|
|
|
|
|
|
|
|