|
|
کاربرد xgboost برای پیشبینی درماندگی مالی شرکت های پذیرفته شده در فرابورس و بورس اوراق بهادار تهران
|
|
|
|
|
نویسنده
|
ابراهیمی شهلا ,نمازی محمد
|
منبع
|
تحقيقات حسابداري و حسابرسي - 1403 - شماره : 62 - صفحه:5 -26
|
چکیده
|
هدف این مقاله، پیشبینی درماندگی مالی بالقوه شرکتهای پذیرفته شده در فرابورس و بورس اوراق بهادار است. بدین منظور، دامنه گستردهای از ویژگیها از جمله متغیرهای حسابداری تعهدی، حسابداری نقدی، بازار سهام، مکانیسمهای حاکمیت شرکتی و شاخصهای اقتصاد کلان برای پیشبینی درماندگی مالی شرکتهای نمونه شناسایی شدهاند. نمونه نهایی شامل 421 شرکت و در نتیجه، 3670 شرکت سال مشاهده است. سپس، داده آماده شده با استفاده از نسبت 70 به 30 به مجموعه داده آموزشی و آزمایشی تفکیک شد. در این پژوهش، تکینکهای پیش پردازش داده یادگیری ماشین نظیر استانداردسازی نمره z، وان هات انکدینگ، اعتبارسنجی متقابل k لایه طبقهای، همراه با مهندسی ویژگی برای بهبود عملکرد طبقهبندی کننده بکار گرفته شدند. روش اعتبارسنجی متقابل k لایه طبقهای با (5=k) برای برآورد عملکرد پیشبینی مدل طی مرحله آموزش استفاده شد. طی مرحله آموزش، میزانسازی اَبرپارامتر مدل با استفاده از جستجوی شبکهای انجام شد. افزون بر این، تکنیک smote همراه با معیار مختص مسائل نامتوازن یعنی نمره f1 برای غلبه بر مساله نامتوازنی افراطی کلاسها استفاده شده است.بر اساس نتایج تجربی، مدل xgboost به نمرهf1، ضریب همبستگی متیوز، فراخوانی و دقتی به ترتیب برابر با 90%، 90%، 100% و 82% بر روی مجموعه آموزشی دست یافت. سرانجام، مدل پیشنهادی بر روی مجموعه آزمایشی کنار گذاشته شده آزمون شد که به نمرهf1، ضریب همبستگی متیوز، فراخوانی و دقتی به ترتیب برابر با 52%، 52%، 73% و 41% بر روی مجموعه آزمایشی منجر شد. این اطلاعات، ابزار قدرتمندی برای پیش بینی درماندگی مالی شرکت ها فراهم می کنند.
|
کلیدواژه
|
پیشبینی درماندگی مالی، یادگیری ماشین، دادهکاوی، بورس اوراق بهادار تهران، xgboost
|
آدرس
|
دانشگاه شیراز, ایران, دانشگاه شیراز, ایران
|
پست الکترونیکی
|
mnamazi@rose.shirazu.ac.ir
|
|
|
|
|
|
|
|
|
application of xgboost to predict financial distress of the listed companies on tehran stock exchange (tse) and iran fara burse (ifb)
|
|
|
Authors
|
ebrahimi shahla ,namazi mohammad
|
Abstract
|
the purpose of this article is to predict the potential financial distress of the listed companies on tehran stock exchange (tse) and iran fara bourse (ifb). to do so, a wide range of features including accrual accounting variables, cash based accounting variables, market based variables, corporate governance mechanisms, and macroeconomic indicators have been identified to prospectively predict the financial distress in the companies.the final sample includes 421 firms leading to 3,670 firm year observations. the prepared data, was then split into a train and test data set using a 70/30 ratio.in this research, various data pre processing machine learning techniques i.e., z score standardization, one hot encoding, stratified k fold validation combined with feature engineering are applied to improve classifier performance. stratified k fold cross validation method, (with k = 5) was used for estimation of model prediction performance during training phase. during the training phase, hyper parameter tuning of a model was carried out using a grid search. furthermore, smote technique in conjunction with the proposed imbalance oriented metric i.e., f1 score were used to overcome the extreme class imbalance issue.based on the experimental results, the tuned xgboost model achieved a f1 score, mcc, recall and precision of respectively, 90%, 90%, 100% and 82% on the training set. finally, the proposed model was tested on the hold out test set which resulted in a f1 score, mcc, recall and precision of 52%, 52%, 73% and 41%, respectively. this information provides a powerful tool for predicting the financial distress of companies.
|
Keywords
|
financial distress prediction ,xgboost ,machine learning ,data mining ,tehran stock exchange
|
|
|
|
|
|
|
|
|
|
|