|
|
ارائه یک چارچوب انتخاب ویژگی در تشخیص تقلبات مالی از طریق بهکارگیری روشهای تفسیرپذیر
|
|
|
|
|
نویسنده
|
علیزاده فرد سجاد ,رحمانی حسین ,اله قلی میلاد ,ابطحی سید مجتبی
|
منبع
|
ششمين همايش ملي فناوريهاي نوين در مهندسي برق، كامپيوتر و مكانيك ايران - 1402 - دوره : 6 - ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران - کد همایش: 02221-18264 - صفحه:0 -0
|
چکیده
|
تقلب در دادههای مالی یک نگرانی جدی برای سازمانهای تجاری و افراد است. با ظهور تجارت الکترونیک در دهه گذشته، استفاده از کارتهای اعتباری به طور چشمگیری افزایش یافتهاست. کشف مناسب تقلب به بازرسان اجازه میدهد اقدامات به موقع انجام دهند و از خسارات مالی بیشتر جلوگیری کنند. در سالهای اخیر روشهای مختلفی برای شناسایی تقلب در دادههای مالی پیشنهاد شدهاست. از مراحل اصلی در فرایند کشف تقلب، مرحله انتخاب ویژگیها است که تاثیر مهمی بر دقت و زمان اجرای مدلها دارد. در این مقاله، ما از طریق ترکیب الگویتم anova با الگوریتمهای تفسیرپذیر shap و lime یک چارچوب انتخاب ویژگی به نام anolish ارائه میدهیم. نتایج ارزیابی چارچوب anolish نشان میدهد، ترکیب الگوریتمهای تفسیرپذیر با anova، ضمن تاثیر مثبت بر مرحله انتخاب ویژگیها، به طور میانگین باعث افزایش دقت مدلها براساس معیارهای درستی (6/5+)، فراخوانی (1/5+)، معیار f (+3/5) و auc (+6/75) شده و در مقایسه با سایر الگوریتمهای انتخاب ویژگی بهترین عملکرد را به ارمغان میآورد.
|
کلیدواژه
|
کشف تقلب،یادگیری ماشین، انتخاب ویژگیها، یادگیری گروهی، تفسیرپذیری، دادهکاوی
|
آدرس
|
, iran, , iran, , iran, , iran
|
پست الکترونیکی
|
mojtaba_abtahi@comp.iust.ac.ir
|
|
|
|
|
|
|
|
|
anolish: novel feature selection framework in financial fraud detection by using of interpretable methods
|
|
|
Authors
|
|
Abstract
|
fraud in financial data is a serious concern for business organizations and individuals. with the rise of e-commerce in the last decade, the use of credit cards has increased dramatically. proper fraud detection allows investigators to take timely action and prevent further financial losses. in recent years, various methods have been proposed to detect frauds in financial data. one of the main steps in the fraud detection process is the feature selection step, which has an important impact on the accuracy and execution time of the models. in this paper, we propose a novel feature selection framework called anolish by combining the anova algorithm with the explainable algorithms like shap and lime. the evaluation results of the anolish framework show that the combination of explainable algorithms with anova, while having a positive effect on the feature selection stage, on average increases the accuracy of the models based on the precision (+6.5), recall (+1.5), f-score (+ 3.5) and auc (+6.75) and brings the best performance compared to other feature selection algorithms.
|
Keywords
|
fraud detection ,machine learning ,feature selection ,ensemble learning ,explainability ,data mining
|
|
|
|
|
|
|
|
|
|
|