|
|
بهبود روش شناسایی وب سایت فیشینگ با استفاده از دادهکاوی روی صفحات وب
|
|
|
|
|
نویسنده
|
بهارلو مهدیه ,یاری علیرضا
|
منبع
|
فناوري اطلاعات و ارتباطات ايران - 1399 - دوره : 12 - شماره : 43-44 - صفحه:27 -38
|
چکیده
|
فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسبوکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایتهای فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگیهای برجسته از فیشینگ یکی از پیششرطهای مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگیهای نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وبسایتهای فیشینگ آماده گردید. سپس برای افزایش کارایی سامانههای تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگیها بهطور قابلتوجهی کاهش یابند. پسازآن عملکرد روشهای درخت تصمیم j48، جنگل تصادفی و بیزین ساده بر روی ویژگیهای کاهشیافته موردبررسی قرار گرفت. نتایج نشان میدهند دقت مدل ایجاد شده برای تعیین وب سایتهای فیشینگ با استفاده از کاهش ویژگی دومرحلهای مبتنی بر پوششی و الگوریتم تحلیل مولفه اصلی (pca) در روش جنگل تصادفی 96٫58% میباشد که نسبت به سایر روشها نتیجه مطلوبی است.
|
کلیدواژه
|
فیشینگ، دادهکاوی، انتخاب ویژگی، استخراج ویژگی
|
آدرس
|
دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, ایران, پژوهشگاه ارتباطات و فناوری اطلاعات, ایران
|
پست الکترونیکی
|
a_yari@itrc.ac.ir
|
|
|
|
|
|
|
|
|
An Improved Method for Detecting Phishing Websites Using Data Mining on Web Pages
|
|
|
Authors
|
baharloo mahdiye ,Yari Alireza
|
Abstract
|
Phishing plays a negative role in reducing the trust among the users in the business network based on the Ecommerce framework. therefore, in this research, we tried to detect phishing websites using data mining. The detection of the outstanding features of phishing is regarded as one of the important prerequisites in designing an accurate detection system. Therefore, in order to detect phishing features, a list of 30 features suggested by phishing websites was first prepared. Then, a twostage feature reduction method based on feature selection and extraction were proposed to enhance the efficiency of phishing detection systems, which was able to reduce the number of features significantly. Finally, the performance of decision tree J48, random forest, naïve Bayes methods were evaluated{cke_protected_1}{cke_protected_2}{cke_protected_3}{cke_protected_4} on the reduced features. The results indicated that accuracy of the model created to determine the phishing websites by using the twostage feature reduction based Wrapper and Principal Component Analysis (PCA) algorithm in the random forest method of 96.58%, which is a desirable outcome compared to other methods.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|