یک روش یادگیری تجمعی جدید در اسپم فیلترینگ متنی

Fa | Ar | En

یک روش یادگیری تجمعی جدید در اسپم فیلترینگ متنی

DOR	20.1001.2.9819073572.1399.3.1.43.9
نویسنده	مثقالی سمن ,عسگری جواد
منبع	كنفرانس ملي فناوريهاي نوين در مهندسي برق و كامپيوتر - 1399 - دوره : 3 - سومین کنفرانس ملی فناوریهای نوین در مهندسی برق و کامپیوتر - کد همایش: 98190-73572
چکیده	اسپم های متنی، پیام هایی ناخواسته هستند که امروزه به صورت ایمیل یا پیام کوتاه دریافت می شوند. با توجه به افزایش حجم اسپم های تولیدی و با توجه به میزان ایمیل های متفاوتی نظیر شغلی، شخصی و سایر موارد که به طور روزانه دریافت می کنیم، بسیار مهم است که بتوانیم ایمیل های اسپم را شناسایی نماییم. از این رو هر پلتفرم ارسال و دریافت پیامی باید مجهز به یک سیستم تشخیص اسپم قوی باشد تا بتواند اسپم ها را در بدو ورود تشخیص داده و فیلتر کند. امروزه روش های متعددی برای تشخیص اسپم ارائه شده و اغلب در تشخیص اسپم ها موفق عمل می کنند. اما چالشی که در این حوزه هست، وجود false positive(fp) در تشخیص ها است. یعنی پیام های مشروع که به اشتباه به عنوان اسپم شناخته شده و فیلتر می شوند. در این مقاله یک روش جدید یادگیری تجمعی به منظور اسپم فیلترینگ ارائه می شود. در این روش برخلاف دیگر روش های یادگیری تجمعی که زیرمجموعه ها را بدون توجه به مکان نمونه ها انتخاب می کنند، هر زیرمجموعه از مکان مشخصی انتخاب می شود و برای تعیین برچسب نهایی متن، بین یادگیرنده هایی که توسط زیرمجموعه ها آموزش داده شده اند، رای گیری اکثریت برگزار می شود. نتایج نشان می دهند روش پیشنهادی به طور قابل ملاحظه ای دقت اسپم فیلترینگ را افزایش داده و fp را کاهش می دهد.
کلیدواژه	اسپم فیلترینگ ,یادگیری ماشین ,یادگیری تجمعی ,ایمیل ,پیام کوتاه
آدرس	دانشگاه صنعتی اصفهان, ایران, دانشگاه صنعتی اصفهان, ایران



Authors