ارائه یک روش مبتنی بر محتوا برای تشخیص هرزنامه در سرویس پیام کوتاه
|
|
|
DOR
|
20.1001.2.0020135610.1400.4.1.168.1
|
نویسنده
|
حسینی محمدرضا ,مظفری نیلوفر ,حمزه علی
|
منبع
|
همايش ملي فناوريهاي نوين در مهندسي برق، مكانيك و كامپيوتر ايران - 1400 - دوره : 4 - چهارمین همایش ملی فناوریهای نوین در مهندسی برق، مکانیک و کامپیوتر ایران - کد همایش: 00201-35610
|
چکیده
|
خدمات پیام کوتاه یا به اختصار sms محصول ارتباطات مدرن بواسطه موبایل است که امکان برقراری ارتباط به صورت راحت و با حداقل هزینه ممکن را فراهم میکند. ویژگیهای پیام کوتاه در برقراری ارتباط ساده، باعث گردیده سازمانهای مختلف برای معرفی خدمات و محصولات خود از این سرویس، جهت اطلاع رسانی استفاده کنند. استفاده از پیامهای تبلیغاتی اگرچه برای تولیدکنندگان خدمات و محصولات بسیار به صرفه و سودمند میباشد؛ اما از طرف دیگر برای کاربران مشکل زاست. از اینرو محققان بدنبال روشهایی هستند که بتواند پیامهای هرزنامه یا ناخواسته را از دیگر پیامها تفکیک کنند. اغلب روشهایی که تاکنون ارائه شدهاند، مبتنی بر روشهای یادگیری ماشین بوده و دارای دو محدودیت اصلی هستند؛ این روشها غالبا از تعداد ویژگیهای بسیاری استفاده میکنند که باعث میشود پیچیدگیهای محاسباتی و زمانی روش افزایش یابد و از طرف دیگر به مشکل عدم توازن دادهها نیز بی توجه میباشند. در این راستا در این مقاله از 6 ویژگی منحصر بفرد برای تفکیک پیامها استفاده شده و برای رفع مشکل عدم توازن دادهها نیز از تکنیک بازنمونهگیری بهره برده شده است و در نهایت با استفاده از الگوریتم جنگل تصادفی شناسایی پیامهای هرزنامه انجام شده است. نتایج حاصل بر روی پایگاه داده پیام کوتاه uci با بیش از 5000 پیام نشان میدهد که روش پیشنهادی در تشخیص پیامهای هرزنامه به صحت 99.83% دست یافته است، که بیانگر موفقیت آن در مقایسه با روشهای پیشین میباشد.
|
کلیدواژه
|
شناسایی هرزنامه ,تکنیک باز نمونهگیری ,یادگیری ماشین ,پیام کوتاه ,الگوریتم جنگل تصادفی
|
آدرس
|
دانشگاه شیراز, ایران, مرکز منطقهای اطلاعرسانی علوم و فناوری،, ایران, دانشگاه شیراز, ایران
|
|
|
|
|
|
|