بهبود طبقه بندی قطعات فایل با انتخاب ویژگی به روش ترکیبی فیلتر و جایگشت
|
|
|
|
|
نویسنده
|
زارع فرخادی رویا
|
منبع
|
تحول ديجيتال و سيستم هاي هوشمند - 1400 - دوره : 1 - تحول دیجیتال و سیستم های هوشمند - کد همایش: 00210-75069 - صفحه:147 -155
|
چکیده
|
شناسایی نوع فایل های قطعه بندی شده یک کار بسیار مهم در آنالیز forensic محسوب میشود که می توان با چندین روش آن را انجام داد. یکی از روش های متداول برای تعیین ویژگی فایل ها؛ استخراج قسمتی از فایل بعنوان ورودی برای استفاده از الگوریتم های طبقه بندی است. گرچه این روش مشکل بزرگ داده ها را در پی دارد و تعدد ویژگی های استخراج شده بسیار زیاد است. این مشکل سبب میشود یادگیری و طبقه بندی، نادرست و ناکارآمد باشد. در این مقاله یک روش ترکیبی برای حل این مسئله با استفاده از فیلتر بندی و ( wrappers ) پیشنهاد می شود تا تعداد ویژگی های موجود را بطور قابل توجهی کاهش داده و همچنین دقت طبقه بندی فایل ها نیز بهبود یابد. در مرحله اول از 3 فیلتر مناسب جهت فیلتر کردن تعدادی زیادی از ویژگی های موجود بی ربط و یا کم اهمیت استفاده میشود، سپس آن ها را ترکیب می کند و سپس برخی ( wrappers ) به جهت کاهش تعداد ویژگی های اضافی و انتخاب ویژگی های برجسته از بین آن ها استفاده می شود. در این مقاله، از دیتاست gov-docs (یک پایگاه داده نشریه ای از سراسر ایالات متحده) استفاده شده است. نتایج آزمایش های انجام شده نشان می دهد که روش ما توانسته است تعداد ویژگی ها را از 66313 به 11الی 32 کاهش دهد؛ همچنین در مقایسه با سایر روش هایی که از همه ویژگی های موجود استفاده می کند؛ این روش دقت طبقه بندی را نیز بهبود می بخشد.
|
کلیدواژه
|
wrapper ,ویژگی ,فیلتر ,forensic
|
آدرس
|
آموزش عالی و غیرانتفاعی رشدیه, ایران
|
|
|
|
|
|
|