ارزیابی مدل‌های یادگیری عمیق برای تولید داده آزمون در فازرهای مبتنی بر فایل

Fa | Ar | En

ارزیابی مدل‌های یادگیری عمیق برای تولید داده آزمون در فازرهای مبتنی بر فایل


نویسنده	تقوی محمد تقی ,باقری مسعود
منبع	پدافند الكترونيكي و سايبري - 1401 - دوره : 10 - شماره : 2 - صفحه:57 -73
چکیده	فازینگ به معنی اجرای مکرر برنامه تحت آزمون با ورودی های تغییر یافته، با هدف یافتن آسیب پذیری است. در صورتی که ورودی های برنامه تحت آزمون دارای ساختار پیچیده ای باشند، تولید ورودی های تغییر یافته برای انجام فازینگ کار راحتی نیست. بهترین راه حل در این موارد، استفاده از ساختار ورودی برنامه تحت آزمون به‌منظور تولید دقیق داده آزمون است. مشکلی که وجود دارد این است که ممکن است مستندات ساختار ورودی برنامه تحت آزمون در دسترس نباشد. همچنین درک انسانی چنین ساختارهای پیچیده ای نیز بسیار مشکل، پرهزینه، زمان بر و مستعد خطای انسانی است. برای غلبه بر مشکلات فوق، استفاده از یادگیری ماشین و شبکه های عصبی عمیق به‌منظور یادگیری خودکار ساختارهای پیچیده ورودی های برنامه و تولید داده آزمون متناسب با این ساختار پیشنهاد شده است. یکی از چالش های اصلی در این زمینه، استفاده از مدل یادگیری متناسب با کاربرد مورد نظر است. در این مقاله، مدل های یادگیری عمیق مناسب برای یادگیری و تولید داده آزمون در فازرهای مبتنی بر فایل مورد بررسی قرار گرفته است. همچنین با معرفی پارامترهای مناسب برای بررسی کارایی، ارزیابی مدل های یادگیری عمیق انجام شده است. بر این اساس، شبکه های عصبی بازرخداد و مشتقات آن به‌عنوان بهترین مدل های یادگیری عمیق برای داده های متنی انتخاب شده است. همچنین پارامترهای موثر برای ارزیابی کارایی مدل های یادگیری عمیق شامل زمان آموزش، میزان خطای مدل ها در زمان آموزش و و زمان ارزیابی درنظر گرفته شده است. پارامتر میزان خطا به‌عنوان پارامتر اصلی، یک بار در مدل های یادگیری عمیق مختلف با ساختار یکسان و یک بار در مدل های یادگیری عمیق یکسان با ساختار متفاوت مورد ارزیابی قرار گرفته و بهترین مدل یادگیری عمیق انتخاب و معرفی شده است.
کلیدواژه	فازینگ، یادگیری عمیق، تولید داده آزمون متنی، ارزیابی کارایی
آدرس	دانشگاه جامع امام حسین (ع), ایران, دانشگاه جامع امام حسین (ع), ایران
پست الکترونیکی	mbagheri@ihu.ac.ir

evaluating deep learning models for test data generation in file based fuzzers

Authors	taghavi m.t ,bagheri m
Abstract	fuzzing means repeatedly running the program being tested, by modified inputs, with the aim of finding its vulnerabilities. if the program has a complex input structure, generating modified inputs for fuzzing is not an easy task. the best solution in such cases is to use the input structure of the program under test to produce accurate test data. the problem is that the input structure documentation of program under test may not be available. human understanding of such complex structures is also hard to achieve, costly, time consuming, and prone to errors. to overcome to above problems, this research proposes the use of machine learning and deep neural networks, which automatically learn the complex structures of program inputs and generate test data tailored to this structure. one of main challenges in this field is choosing the appropriate deep learning model which suits the intended application. in this paper, suitable deep learning models for learning and test data generation in file-based fuzzers are studied. also, the evaluation is performed by introducing and applying the appropriate performance evaluation parameters. so the recurrent neural network and its derivations are introduced as the best deep learning models for text data. also, effective parameters considered for performance evaluation include the training time, loss value in training and evaluation time. the loss value as the main parameter is evaluated once in various deep learning models with same structure and again in the same deep learning models with various structures and the best deep learning model is selected and proposed.