|
|
ترکیب روش های تجمیعی داده کاوی برای کشف تراکنش های تقلب در کارت های اعتباری
|
|
|
|
|
نویسنده
|
بختیاری سعید ,نصیری زهرا ,حجازی محمد صادق
|
منبع
|
پردازش علائم و داده ها - 1401 - شماره : 4 - صفحه:121 -136
|
چکیده
|
کارت های اعتباری باعث سرعت بخشیدن و سهولت زندگی تمامی شهروندان و مشتریان بانک ها می شود. این امر موجب استفاده گسترده و روزافزون جهت پرداخت آسان پول از طریق تلفن همراه، اینترنت، دستگاههای خودپرداز و غیره می باشد. با وجود محبوبیت کارت های اعتباری، مشکلات امنیتی مختلف مانند تقلب برای آن وجود دارد. همان طور که روش های امنیتی بروز می شوند، متقلبان نیز روش های خود را بروز می کنند که این امر موجب نگرانی بانک ها و مشتریان آنها می شود. به همین دلیل محققان سعی کردند راه حل های مختلفی جهت تشخیص، پیش بینی و پیشگیری از تقلب در کارت های اعتباری ارائه دهند. یکی از روش ها روش داده کاوی و یادگیری ماشین است. یکی از با اهمیت ترین مسائل در این زمینه، دقت و کارایی است. در این پژوهش روش های gradient boosting که زیر مجموعه روش های تجمیعی و یادگیری ماشین هستند را بررسی کرده و با ترکیب روش ها نرخ خطا را کاهش و دقت تشخیص را بهبود می دهیم. بنابراین دو الگوریتم lightgbm و xgboost را مقایسه کرده و سپس آنها را با استفاده از روش های تجمیعی میانگین گیری ساده و وزن دار ترکیب نمودیم و در نهایت مدل ها را بوسیله auc و recall وscore - f1 و precisionو accuracy ارزیابی کردیم. مدل پیشنهادی پس از اعمال مهندسی ویژگی با استفاده از روش میانگین گیری وزن دار به ترتیب برای روش های ارزیابی مذکور به اعدادی معادل 95.08، 90.57، 89.35، 88.28 و 99.27 رسیده است. بر این اساس مهندسی ویژگی و میانگین گیری وزن دار تاثیر به سزایی در بهبود دقت پیش بینی و شناسایی داشتند.
|
کلیدواژه
|
تشخیص تقلب، کارت اعتباری، یادگیری تجمیعی، داده کاوی
|
آدرس
|
دانشگاه امین, دانشکده اطلاعات, گروه فتا, ایران, موسسه آموزش عالی آل طه, دانشکده فنی و مهندسی, گروه کامپیوت, ایران, موسسه آموزش عالی پردیسان, دانشکده فنی و مهندسی, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
sadegh.hejazi@hotmail.com
|
|
|
|
|
|
|
|
|
combination of ensemble data mining methods for detecting credit card fraud transactions
|
|
|
Authors
|
bakhtiari saeid ,nasiri zahra ,hejazi mohammad sadegh
|
Abstract
|
as we know, credit cards speed up and make life easier for all citizens and bank customers. they can use it anytime and anyplace according to their personal needs, instantly and quickly and without hassle, without worrying about carrying a lot of cash and more security than having liquidity. together, these factors make credit cards one of the most popular forms of online banking. this has led to widespread and increasing use for easy payment for purchases made through mobile phones, the internet, atms, and so on. despite the popularity and ease of payment with credit cards, there are various security problems, increasing day by day. one of the most important and constant challenges in this field is credit card fraud all around the world. due to the increasing security issues in credit cards, fraudsters are also updating themselves. in general, as a field grows in popularity, more fraudsters are attracted to it, and this is where credit card security comes into play. so naturally, this worries banks and their customers around the world. meanwhile, financial information acts as the main factor in market financial transactions. for this reason, many researchers have tried to prioritize various solutions for detecting, predicting, and preventing credit card fraud in their research work and provide essential suggestions that have been associated with significant success. one of the practical and successful methods is data mining and machine learning. in these methods, one of the most critical parameters in fraud prediction and detection is the accuracy of fraud transaction detection. this research intends to examine the gradient boosting methods, which are a subset of ensemble learning and machine learning methods. by combining these methods, we can identify credit card fraud, reduce error rates, and improve the detection process, which in turn increases efficiency and accuracy. this study compared the two algorithms lightgbm and xgboost, merged them using simple and weighted averaging techniques, and then evaluate the models using auc, recall, f1-score, precision, and accuracy. the proposed model provided 95.08, 90.57, 89.35, 88.28, and 99.27, respectively, after applying feature engineering and using the weighted average approach for the mentioned validation parameters. as a result, function engineering and weighted averaging significantly improved prediction and detection accuracy.
|
Keywords
|
fraud detection ,credit card ,ensemble learning ,data mining
|
|
|
|
|
|
|
|
|
|
|