|
|
|
|
پیشبینی ریزش مشتریان بانک با استفاده از یادگیری ماشین
|
|
|
|
|
|
|
|
نویسنده
|
محمودزاده محمدحسین ,شیرعلی شهرضا محمدحسن ,محدث خراسانی علی
|
|
منبع
|
تحقيقات مالي - 1404 - دوره : 27 - شماره : 2 - صفحه:218 -245
|
|
چکیده
|
هدف: در بازارهای رقابتی، شرکتها روی برقراری روابط بلندمدت با مشتریان و تقویت وفاداری تمرکز دارند. بهعلت هزینههای سنگین جذب مشتری جدید، کسبوکارها روی نگهداری مشتریان موجود تمرکز میکنند. پیشبینی مشتریانی که احتمال رویگردانی آنها در آینده وجود دارد، بخش مهمی از راهبرد حفظ مشتری است. در این مقاله پیشبینی ریزش مشتری در صنعت بانکداری، روی دادگان واقعی مشتریان یکی از بانکهای بزرگ ایران انجام شده است.روش: در صنعت بانکداری، کاهش شدید میانگین مانده موثر یک مشتری در یک بازۀ زمانی نسبت به بازۀ زمانی قبلی، بهعنوان ریزش مشتری در نظر گرفته میشود. در این مقاله، ابتدا با پردازش حجم زیادی از تراکنشهای بانکی در یک بازۀ زمانی مشخص، ویژگیهای رفتاری متفاوت در سطوح مختلف برای مشتریان بهدست آمد؛ سپس برای پیشبینی ریزش، از الگوریتمهای پُراستفاده در یادگیری ماشین و روشهای یادگیری جمعی استفاده شد. در ادامه، با استفاده از روشهای یادگیری عمیق و واحدهای نوین آن، معماری مدل مدنظر ارائه شد. در نهایت، با انجام آزمایشهای جامع، عملکرد روشهای نام برده بررسی شد.یافتهها: این پژوهش در یکی از بانکهای بزرگ ایران اجرا شد و آزمایشها روی دادگان واقعی مشتریان بانک صورت پذیرفت. در این آزمایشها، از اطلاعات جمعیتشناختی و رفتار گذشته مشتریان بهره گرفته شد؛ اما از اطلاعات شخصی افراد استفاده نشد تا حریم خصوصی مشتریان حفظ شود. در آزمایشهای صورتگرفته، پیشبینی ریزش مشتری روی بازۀ زمانی یک ماهه انجام گرفت. بدین ترتیب دو بازۀ یکماهه متوالی مدنظر قرار گرفت و ویژگیهای رفتاری مشتریان، از بازۀ زمانی اول استخراج شد. متغیر هدف نیز از مقایسه میانگین مانده موثر در بازههای زمانی اول و دوم بهدست آمد. در صورتی که میانگین ماندۀ موثر یک مشتری، در بازۀ دوم نسبت به بازۀ اول با بیش از 70درصد کاهش همراه بود، بهعنوان ریزش در نظر گرفته شد. در نتایج بهدستآمده الگوریتمهای یادگیری جمعی و همچنین مدلهای عمیق ارائهشده، عملکرد بهتری را نسبت به مدلهای مبنا نشان دادند. افزایش اندازۀ مجموعۀ آموزش در عملکرد بهتر مدلها موثر بود. مدل تقویت گرادیان با 0.8984 بیشترین مساحت زیر منحنی مشخصۀ عامل گیرنده نسبت به مجموعۀ اعتبارسنجی را بهدست آورد.نتیجهگیری: استخراج ویژگیهای رفتاری از تراکنشهای بانکی مشتریان و استفاده از روشهای یادگیری جمعی و همچنین مدلهای ارائهشده مبتنیبر یادگیری عمیق، در پیشبینی ریزش مشتری موثرند. پس از تحلیل رفتار و شناسایی مشتریان در شرف رویگردانی، پیشنهادهایی برای جلوگیری از ریزش و حفظ مشتری ارائه شد. برای نمونه، تفکیک مشتریان بر اساس سن، شغل، تحصیلات و غیره بهمنظور ارائه خدمات و تولید محصولات بانکی بر این مبنا، ایجاد تنوع در خدمات موجود، ارائۀ خدمات مورد نیاز مشتریان از طریق بسترهای مجازی و در صورت نیاز در محل فعالیت و زندگی مشتریان، تسهیل در ارائۀ خدمات مطلوب به مشتریان، افزایش اعتماد مشتریان از طریق ارائۀ کاربردیِ امن و همچنین، حفاظت از اطلاعات مشتریان، به حفظ مشتری کمک میکند.
|
|
کلیدواژه
|
پیشبینی ریزش مشتری، بانکداری، یادگیری عمیق، یادگیری ماشین
|
|
آدرس
|
دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران), دانشکده ریاضی و علوم کامپیوتر, گروه علوم کامپیوتر, ایران, دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران), دانشکده ریاضی و علوم کامپیوتر, گروه علوم کامپیوتر, ایران, دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران), دانشکده ریاضی و علوم کامپیوتر, گروه علوم کامپیوتر, ایران
|
|
پست الکترونیکی
|
mohades@aut.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
|
predicting bank customer churn using machine learning
|
|
|
|
|
Authors
|
mahmoudzadeh mohammad hossein ,shirali shahreza mohammad hassan ,mohades khorasani ali
|
|
Abstract
|
objectivein competitive markets, companies focus on establishing long-term relationships with their customers and strengthening their loyalty. due to the high costs associated with acquiring new customers, businesses tend to focus on retaining existing ones. predicting which customers are likely to churn in the future plays a crucial role in shaping effective customer retention strategies. to predict customer churn and identify its drivers, companies use customer information and historical data recorded from them. this paper investigates customer churn prediction in the banking industry using real customer data from one of the largest banks in iran. methodsto analyze and predict customer behavior, two equal and consecutive periods were considered. customer behavior in the first period was used to predict a target variable in the second period. a significant drop in the average effective balance during the second period, compared to the first, was defined as the indicator of customer churn. by processing a large volume of banking transactions in the first period and aggregating them at different levels, various behavioral features for customers. we selected. one fixed validation set and three training sets of different sizes were selected. to address the issue of dataset imbalance, class weights were determined based on the ratio of class sizes, ensuring that the minority class received greater weight during the training process. to predict customer churn, widely used machine learning algorithms—including naive bayes, k-nearest neighbors, support vector machine, logistic regression, and decision tree—were applied, along with ensemble learning methods such as random forest, adaptive boosting, and gradient boosting. subsequently, deep learning methods were applied, and a model incorporating modern modules such as residual connections and layer normalization—similar to state-of-the-art architectures—was proposed. exhaustive experiments were conducted to evaluate the performance of the aforementioned methods. resultsthe results showed that ensemble learning algorithms and the proposed deep learning models outperformed the baseline models. additionally, increasing the size of the training set contributed to improved model performance. among the traditional machine learning classification algorithms, the decision tree trained on two training sets obtained the highest auc roc on the validation set with 0.8531 and 0.8597. the gradient boosting model obtained the overall highest auc roc on the validation set with 0.8984 and 0.9010. deep learning-based single models achieved auc-roc values of 0.8825, 0.8909, and 0.8958, outperforming all traditional methods and two ensemble learning approaches while performing competitively with the gradient boosting algorithm. conclusionextracting behavioral features from customers’ banking transactions and applying ensemble methods, along with the proposed deep learning-based models, proves effective in predicting banking customer churn, particularly in cases of a significant decrease in the average effective balance.
|
|
Keywords
|
banking ,customer churn prediction ,deep learning ,machine learning
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|