بهبود تشخیص وب‌سایت‌های فیشینگ با استفاده از مدل‌های یادگیری ماشین و یادگیری عمیق

Fa | Ar | En

بهبود تشخیص وب‌سایت‌های فیشینگ با استفاده از مدل‌های یادگیری ماشین و یادگیری عمیق


نویسنده	رحیم بیگی چگینی هادی ,پروین نیا الهام
منبع	تحليل مدارها، داده ها و سامانه ها - 1404 - دوره : 3 - شماره : 3 - صفحه:28 -40
چکیده	حملات فیشینگ از تهدیدات مهم امنیت سایبری محسوب می شوند که کاربران اینترنت را هدف قرار داده و اطلاعات محرمانه آن ها را سرقت می کنند. در این پژوهش، یک مدل ترکیبی مبتنی بر یادگیری عمیق با به کارگیری پیش پردازش داده ها، متعادل سازی داده ها و کاهش ابعاد ارائه شده است. نوآوری اصلی این مدل، در ترکیب همزمان چندین تکنیک پیشرفته برای متعادل سازی داده ها، کاهش ابعاد و انتخاب ویژگی ها نهفته است که توانسته مشکلات رایج در داده های نامتوازن را برطرف کند و دقت مدل را به طور چشمگیری افزایش دهد. مجموعه داده مورد استفاده، شامل ویژگی های کلیدی وب سایت ها است. پس از اعمال مراحل پیش پردازش داده ها، انتخاب ویژگی و کاهش ابعاد، مدل های مختلفی از جمله درخت تصمیم، k- نزدیک ترین همسایه و جنگل تصادفی پیاده سازی شدند. به منظور متعادل سازی توزیع کلاس ها، از روش هایی همچون افزایش نمونه سازی مصنوعی اقلیت، نمونه سازی مصنوعی تطبیقی و افزایش نمونه برداری تصادفی استفاده شده است. همچنین، روش های انتخاب ویژگی مبتنی بر کسب اطلاعات و کاهش ابعاد به کار گرفته شدند تا کارایی مدل ها بهبود یابد. نتایج آزمایش ها نشان می دهد که مدل های ترکیبی ارائه شده در این پژوهش، از دقت بالایی در تشخیص وب سایت های فیشینگ برخوردار هستند. مدل شبکه عصبی بازگشتی پیشنهادی با استفاده از روش اعتبارسنجی متقابل به دقت 99٪ در شناسایی این وب سایت ها دست یافته است که در مقایسه با روش های سنتی، عملکرد برتر و کارآمدتری را نشان می دهد
کلیدواژه	فیشینگ، یادگیری ماشین، یادگیری عمیق، انتخاب ویژگی، طبقه‌بندی وب‌سایت‌ها
آدرس	دانشگاه آزاد اسلامی واحد شیراز, گروه مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد شیراز, گروه مهندسی کامپیوتر, ایران
پست الکترونیکی	eparvinnia@gmail.com

improving detection of phishing websites using machine learning and deep learning models

Authors	rahimbeygi chegini hadi ,parvinnia elham
Abstract	phishing attacks represent a significant cybersecurity threat، targeting internet users to steal confidential information. this research presents a hybrid deep learning model that employs data preprocessing، data balancing via smote، and dimensionality reduction via pca. the primary innovation of this model lies in its integrated approach، combining advanced techniques for data balancing، dimensionality reduction، and feature selection. this integration successfully addresses common challenges associated with imbalanced datasets and enhances overall model accuracy. he utilized dataset comprises key website features. following data preprocessing، feature selection، and dimensionality reduction، several models، including decision tree، k-nearest neighbors، and random forest، were implemented. to mitigate class imbalance، techniques such as the synthetic minority over-sampling technique (smote)، adaptive synthetic sampling (adasyn)، and random over-sampling were applied. furthermore، feature selection methods based on information gain and dimensionality reduction were used to optimize model efficiency. experimental results demonstrate that the proposed hybrid models achieve high accuracy in detecting phishing websites. notably، the proposed recurrent neural network (rnn) model attained 99% accuracy in identifying phishing websites using cross-validation، outperforming traditional methods
Keywords	phishing ,machine learning ,deep learning ,feature selection ,website classification