|
|
ارائه روشی جدید جهت بهبود تشخیص نفوذ با استفاده از ترکیب الگوریتم جنگل تصادفی و الگوریتم ژنتیک
|
|
|
|
|
نویسنده
|
کاظمیتبار جواد ,طاهری امیری ریحانه ,خردمندیان قربان
|
منبع
|
علوم و فناوري هاي پدافند نوين - 1398 - دوره : 10 - شماره : 3 - صفحه:287 -296
|
چکیده
|
همگام با گسترش شبکههای کامپیوتری، حملات و نفوذها به این شبکهها نیز افزایش یافته است. برای داشتن امنیت کامل در یک سامانه کامپیوتری، علاوه بر فایروالها و دیگر تجهیزات جلوگیری از نفوذ، سامانههای دیگری به نام سامانههای تشخیص نفوذ (ids) مورد نیاز هستند. هدف از یک سامانه تشخیص نفوذ نظارت بر فعالیتهای غیرعادی و افتراق بین رفتارهای طبیعی و غیرطبیعی (نفوذ) در یک سامانه میزبان و یا در یک شبکه است. یک سامانه تشخیص نفوذ را زمانی میتوان کارا دانست که نرخ تشخیص نفوذ بالا و به صورت همزمان نرخ هشدار اشتباه کمی را دارا باشد. در این مقاله روشی جدید جهت طبقهبندی مجموعه داده kddcup99 معرفی شده است که از ترکیب الگوریتم جنگل تصادفی و الگوریتم ژنتیک حاصل شده است و هدف آن افزایش سرعت فاز یادگیری و آزمون و همچنین دقت روش جنگل تصادفی است. از جنگل تصادفی به دلیل ساختار ساده و کارایی بالای آن در بسیاری از محصولات مبتنی بر یادگیری ماشین استفاده میشود. ولی مانند دیگر الگوریتم های مبتنی بر درخت تصمیم، وجود تعداد زیادی متغیر غیرعددی (نوعی) میتواند برای دقت و سرعت برنامه مشکل ایجاد کند. در مسئله تشخیص نفوذ دقیقاً ما با چنین سناریویی مواجه هستیم. نوآوری این مقاله، حل این معضل با استفاده از الگوریتم ژنتیک است. در این مقاله با تعریف کردن معیاری با نام بهره اطلاعات، تعداد ویژگی ها کاهش یافته است.
|
کلیدواژه
|
تشخیص نفوذ مبتنی بر الگوی رفتاری، دادهکاوی، الگوریتم ژنتیک، الگوریتم جنگل تصادفی
|
آدرس
|
دانشگاه صنعتی نوشیروانی بابل, ایران, دانشگاه علوم و فنون مازندران, ایران, شرکت داده کاوان هوشمند توسن, ایران
|
|
|
|
|
|
|
|
|
|
|
A Novel Technique for Improvement of Intrusion Detection via Combining Random Forrest and Genetic Algorithm
|
|
|
Authors
|
Kazemitabar seyyed Javad ,Taheri Reyhaneh ,Sharifi Mohammad Nader
|
Abstract
|
As computer networks grow, so attacks and intrusions to these networks are increased. In order to have a fully secure computer network, one needs ‘intrusion detection systems’ (IDS) on top of firewalls. The goal of using an IDS is to supervise the abnormal activities and differentiate between normal and abnormal activities in a host system or in a network. An efficient IDS has high detection rate while keeping a low false alarm rate. In this paper, a new approach to classify KDDCup99 data set using a combination of random forest method and genetic algorithm is presented. The purpose is to increase the speed of learning and test phases while improving the accuracy. Random forest is an ensemble learning method based on decision trees. Due to its relatively simple structure and good performance, it is used in many supervised learning applications. However, like all tree based machine learning algorithms, having too many categorical features, can be a problem both for the speed and accuracy. This is exactly the case with the problem in hand, i.e. intrusion detection; many of the features are in the form of categorical data. For example, in R language, the maximum number of definable categorical features for random forest is 53. The contribution of this work is resolving this issue with the aid of Genetic Algorithm (GA). In this research information gain as a measure of importance is defined and the number of features is reduced based on genetic algorithm.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|