|
|
کاربرد دادهکاوی با استفاده از الگوریتمهای یادگیری ماشین برای بررسی تاثیر ویژگیهای خودرو در پیشبینی ریسک خسارت مالی در رشته بیمه شخص ثالث
|
|
|
|
|
نویسنده
|
اصغری اسکوئی محمدرضا ,خانی زاده فربد ,بهادر آزاده
|
منبع
|
پژوهشنامه بيمه - 1399 - دوره : 35 - شماره : 1 - صفحه:33 -66
|
چکیده
|
هدف: طبقهبندی ریسک بیمهگذاران بر مبنای ویژگیهای قابل مشاهده میتواند به شرکتهای بیمه جهت کاهش زیان، شناخت دقیقتر مشتریان و جلوگیری از وقوع انتخاب نامساعد در بازار بیمه کمک شایانی کند. هدف این مقاله، بررسی خسارتهای مالی ایجاد شده در بیمه شخص ثالث و پیشبینی ریسک بیمهگذاران در احتمال وقوع حادثه میباشد. روششناسی: با استفاده از الگوریتمهای درخت تصمیم، ماشین بردار پشتیبان، نایو بیز و شبکه عصبی؛ به کشف الگوهای پنهان دادهها، در راستای طبقهبندی بیمهگذاران بیمه شخص ثالث پرداخته شده است. همچنین توزیع نامتعادل دادهها در دو گروه خسارتدیده و خسارتندیده سبب یک چالش مهم در کاربرد روشهای یادگیری ماشین و دادهکاوی است که در این مقاله مورد توجه قرار گرفته است. یافتهها: مجموعه داده متعلق به یکی از شرکتهای بیمه و حاوی بیش از چهارصد هزار نمونه ثبت شده در پنج سال و شامل چهار متغیر مستقل نوع خودرو، گروه خودرو، نوع پلاک و سن خودرو و یک متغیر وابسته و دو ارزشی خسارت مالی است. با توجه به نتایج بدست آمده بهترین کارکرد و دقت پیشبینی (با دقت f1=) مربوط به مدل درخت تصمیم میباشد. نتیجهگیری: میزان تاثیرگذاری متغیرها در وقوع خسارت به ترتیب اولویت عبارتنداز: نوع خودرو، نوع پلاک، سن خودرو و گروه خودرو. نتایج ارزیابی نشان میدهد برای پیشبینی دقیقتر خسارت و مشتریان پر ریسک به دادههای بیشتری مرتبط با ویژگیهای راننده نیاز میباشد.
|
کلیدواژه
|
دستهبندی مشتریان، درخت تصمیم، ماشین بردار پشتیبان، نایو بیز و شبکههای عصبی
|
آدرس
|
دانشگاه علامه طباطبایی, دانشکده علوم ریاضی و رایانه, ایران, پژوهشکده بیمه, ایران, پژوهشکده بیمه, ایران
|
پست الکترونیکی
|
bahador@irc.ac.ir
|
|
|
|
|
|
|
|
|
Application of Data Mining through Machine Learning Algorithms to Study Effect of Car Features in Predicting Financial Claim of Motor Third Party Liability Insurance
|
|
|
Authors
|
Asghari Oskoei Mohammadreza ,Khanizadeh Farbod ,Bahador Azadeh
|
Abstract
|
Objective: Risk classification of insurance customers, based on the observable characteristics, can significantly help insurers mitigate losses, classify their customers and prevent adverse selection. This paper aims to study losses occurred in motor Third Party Liability (TPL) insurance and predict customers’ risk of loss. Methodology: With the help of four supervised algorithms namely; decision tree, SVM, naïve Bayes and neural network hidden pattern of data is discovered to classify customers of TPL insurance. Furthermore, the imbalanced dataset was the main challenge for implementing machine learning and data mining techniques which will be discussed throughout the article. Findings: The dataset contains more than 400,000 observations for five years from an Iranian insurance company. It also has five variables of which four are independent: car type, car group, plate type, car age; and one binary dependent variable: financial loss. Comparing the model performances, decision tree is the most efficient (F1=0.72±1). Conclusions: The model provides prioritization of independent features as follows: car type, plate type, car age, car group. Findings also suggest that to obtain more accurate prediction on claims and highrisk customers, more features concerning drivers’ traits are required. JELClassification: G22, G17, F47
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|