پیش بینی طرح تقلب در گزارشگری مالی با استفاده از رویکرد یادگیری ماشین در فضای چند کلاسه

Fa | Ar | En

پیش بینی طرح تقلب در گزارشگری مالی با استفاده از رویکرد یادگیری ماشین در فضای چند کلاسه


نویسنده	کاظمی توحید ,پیری پرویز
منبع	پژوهش ‌هاي تجربي حسابداري - 1401 - دوره : 12 - شماره : 46 - صفحه:255 -276
چکیده	هدف از انجام پژوهش حاضر بررسی عملکرد الگوهای یادگیری ماشین در پیش بینی طرح های تقلب مورد استفاده در گزارشگری مالی در فضای چند کلاسه با استفاده از مجموعه داده نامتوازن است. از این رو صورت های مالی 134 شرکت‌پذیرفته شده در بورس اوراق بهادار تهران در قلمرو زمانی سال 1387 الی 1399 با استفاده از روش های رگرسیون لجستیک، درخت تصمیم، الگوریتم گرادیان تقویت شده و ماشین بردار پشتیبان مورد تحلیل و بررسی قرار گرفته اند. الگوهای مزبور در محیط پایتون با رویکرد چندکلاسه پیاده سازی و اجرا شدند. معیار ارزیابی عملکرد محاسبه و مقایسه شد. افزون بر این عملکرد الگوهای یادگیری ماشین در تشخیص نوع تقلب در صورت های مالی با رویکرد دوکلاسه و بر اساس مجموعه داده متوازن نیز بررسی گردید. نتایج پژوهش نشان می دهد تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در فضای چند کلاسه وجود دارد و روش ماشین بردار پشتیبان نسبت به سایر روش ها عملکرد بهتری دارد. با تقلیل فضای مسئله به دسته بندی دو کلاسه تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در تشخیص گزارش‌های مالی مشکوک به بیش نمایی دارایی، کم نمایی بدهی و هزینه، بیش نمایی دارایی و کم نمایی هزینه و کم نمایی هزینه و بدهی تایید نشد. با این حال، عملکرد ماشین بردار پشتیبان بر عملکرد روش رگرسیون لجستیک و درخت تصمیم در پیش بینی گزارش‌های مالی مشکوک به بیش نمایی دارایی و درآمد ارجح است. پژوهش حاضر با توسعه فضای مسئله با هدف دسته بندی چندکلاسه سعی دارد شکاف تحقیقاتی موجود در قلمرو موضوعی پژوهش را رفع ‌نماید.
کلیدواژه	طرح تقلب، گزارشگری مالی متقلبانه، یادگیری ماشین، دسته بندی چند کلاسه
آدرس	دانشگاه الزهرا, دانشکده علوم اجتماعی و اقتصادی, گروه حسابداری, ایران, دانشگاه ارومیه, دانشکده اقتصاد و مدیریت, گروه حسابداری, ایران
پست الکترونیکی	p.piri@urmia.ac.ir

financial reporting fraud scheme prediction via machine learning approach – multiclass classification

Authors	kazemi tohid ,piri parviz
Abstract	this paper attempts to evaluate the performance of machine learning models in fraudulent financial reporting schemes prediction via a multi classification approach and using an unbalanced dataset. therefore, the financial statements of 134 companies listed on the tehran stock exchange from 2009 to 2021 were investigated by logistic regression, decision tree, boosting algorithms, and support vector machine. models were programmed with python and performance indicators were calculated and compared. furthermore, the machine learning model’s performance was investigated in binary classification with the balanced dataset to predict each fraud scheme exclusively. according to the results via a multi classification approach, then the significant difference between machine learning models’ performance was approved. support vector machin was preferred in multiclass problem space with the unbalanced data set. to predict fraud schemes via binary classification, a significant difference between machine learning models’ performance was not approved except to predict the “overstatement assets and income” scheme. support vector machin was preferred to logistic regression and decision tree model. the present research attempts to fill the research gap in the research area by developing machine learning models with a multi classification approach.
Keywords	fraud scheme ,fraudulent financial reporting ,machine learning ,multi-classification