تشخیص ایمیل های اسپم با استفاده از الگوریتم های یادگیری ماشین و ابزار spacy
|
|
|
|
|
نویسنده
|
عضو هیات علمی گروه مهندسی کامپیوتر، دانشگاه فنی و حرفه ای، تهران، ایران کاظم تقندیکی
|
منبع
|
هشتمين همايش ملي مطالعات و تحقيقات نوين در حوزه علوم كامپيوتر، برق و مكانيك ايران - 1401 - دوره : 8 - هشتمین همایش ملی مطالعات و تحقیقات نوین در حوزه علوم کامپیوتر، برق و مکانیک ایران - کد همایش: 01211-16575 - صفحه:0 -0
|
چکیده
|
امروزه افراد جامعه با استفاده از ایمیل ها با یکدیگر در سریعترین زمان ممکن برای ارسال اطلاعات و نامه های رسمی ارتباط برقرار می کنند. ایمیل های اسپم یا هرز نامه ها یک چالش اساسی در این نوع ارتباط می باشد که با هدف تبلیغات، صدمه رساندن و سرقت اطلاعات به حساب کاربری افراد به صورت انبوه ارسال شده و باعث پر شدن پوشه ورودی محیط ایمیل آن ها می گردد. لذا تشخیص هرزنامه ها یک چالش اساسی است که تاکنون کارهای زیادی برای تشخیص آن صورت گرفته است. در این مقاله نویسنده با استفاده از کتابخانه پردازش زبان طبیعی spacy و 3 الگوریتم یادگیری ماشین بیز ساده (nb)، درخت تصمیم c4.5 و پرسپترون چندلایه (mlp) در زبان برنامه نویسی پایتون به تشخیص ایمیل های هرزی جمع آوری شده از محیط جیمیل پرداخته است. مشاهدات نشان از نرخ صحت (96%)، نرخ کامل بودن (94%) و نرخ دقت (97%) رویکرد پیشنهادی در تشخیص ایمیل های اسپم را می دهد.
|
کلیدواژه
|
یادگیری ماشین، بیز ساده، درخت تصمیم c4.5، پردازش زبان طبیعی، پرسپترون چندلایه، هرز نامه
|
آدرس
|
, iran
|
|
|
|
|
|
|