>
Fa   |   Ar   |   En
   بهبود روش شناسایی وب سایت فیشینگ با استفاده از داده‌کاوی روی صفحات وب  
   
نویسنده بهارلو مهدیه ,یاری علیرضا
منبع فناوري اطلاعات و ارتباطات ايران - 1399 - دوره : 12 - شماره : 43-44 - صفحه:27 -38
چکیده    فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگی‌های برجسته از فیشینگ یکی از پیش‌شرط‌های مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگی‌های نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وب‌سایت‌های فیشینگ آماده گردید. سپس برای افزایش کارایی سامانه‌های تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله‌ مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگی‌ها به‌طور قابل‌توجهی کاهش یابند. پس‌ازآن عملکرد روش‌های درخت تصمیم j48، جنگل تصادفی و بیزین ساده بر روی ویژگی‌های کاهش‌یافته موردبررسی قرار گرفت. نتایج نشان می‌دهند دقت مدل ایجاد شده برای تعیین وب سایت‌های فیشینگ با استفاده از کاهش ویژگی دومرحله‌ای مبتنی بر پوششی و الگوریتم تحلیل مولفه اصلی (pca) در روش جنگل تصادفی 96٫58% می‌باشد که نسبت به سایر روش‌ها نتیجه مطلوبی است.
کلیدواژه فیشینگ، داده‌کاوی، انتخاب ویژگی، استخراج ویژگی
آدرس دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, ایران, پژوهشگاه ارتباطات و فناوری اطلاعات, ایران
پست الکترونیکی a_yari@itrc.ac.ir
 
   An Improved Method for Detecting Phishing Websites Using Data Mining on Web Pages  
   
Authors baharloo mahdiye ,Yari Alireza
Abstract    Phishing plays a negative role in reducing the trust among the users in the business network based on the Ecommerce framework. therefore, in this research, we tried to detect phishing websites using data mining. The detection of the outstanding features of phishing is regarded as one of the important prerequisites in designing an accurate detection system. Therefore, in order to detect phishing features, a list of 30 features suggested by phishing websites was first prepared. Then, a twostage feature reduction method based on feature selection and extraction were proposed to enhance the efficiency of phishing detection systems, which was able to reduce the number of features significantly. Finally, the performance of decision tree J48, random forest, naïve Bayes methods were evaluated{cke_protected_1}{cke_protected_2}{cke_protected_3}{cke_protected_4} on the reduced features. The results indicated that accuracy of the model created to determine the phishing websites by using the twostage feature reduction based Wrapper and Principal Component Analysis (PCA) algorithm in the random forest method of 96.58%, which is a desirable outcome compared to other methods.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved