>
Fa   |   Ar   |   En
   استفاده از تحلیل احساسات و ترکیب روش های یادگیری ماشین برای تشخیص هرزنامه در توییتر  
   
نویسنده سالخورده حقیقی مهدی ,کرمانی امین الله
منبع فناوري اطلاعات و ارتباطات ايران - 1401 - دوره : 14 - شماره : 51-52 - صفحه:129 -154
چکیده    محبوبیت شبکه های اجتماعی بخصوص توییتر چالش جدیدی را روبروی محققان قرار داده است و آن چیزی نیست جز هرزنامه . روش های گوناگون زیادی برای مقابله با آنها ارائه شده است. بعضی از این روش ها اگرچه در ابتدا کارآمد بودند اما به مرور توسط تولید کنندگان هرزنامه دور زده شدند. در این تحقیق تلاش داریم با استفاده از یکی از جدیدترین روش های تشخیص هرزنامه و ترکیب آن با تحلیل احساسات دقت تشخیص هرزنامه را افزایش دهیم. ما با استفاده از روش تعبیه سازی، کلمات متن توییت را به عنوان ورودی به یک معماری شبکه عصبی پیچشی داده و خروجی تشخیص دهنده متن هرزنامه یا متن عادی خواهد بود. هم زمان با استخراج ویژگی های مناسب در شبکه توییتر و اعمال روش های یادگیری ماشین بر روی آنها تشخیص هرزنامه بودن توییت را بصورت مجزا محاسبه می کنیم. در نهایت خروجی هر دو روش را به یک شبکه پیچشی تلفیقی وارد می کنیم تا خروجی آن تشخیص نهایی هرزنامه یا نرمال بودن متن توییت را تعیین کند. ما در این تحقیق از دو مجموعه داده متعادل و نامتعادل استفاده می کنیم تا تاثیر مدل پیشنهادی را بر روی دو نوع داده بررسی کنیم. نتایج پژوهش نشان دهنده بهبود کارایی روش پیشنهادی در هر دو مجموعه داده می باشد.
کلیدواژه توییتر، هرزنامه، تعبیه لغات، شبکه های عصبی پیچشی، تحلیل احساسات، cnn
آدرس دانشگاه سجاد, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, ایران, دانشگاه سجاد, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, ایران
پست الکترونیکی am.kermani132@sadjad.ac.ir
 
   using sentiment analysis and combining classifiers for spam detection in twitter  
   
Authors salkhordeh haghighi mehdi ,kermani aminolah
Abstract    the welcoming of social networks, especially twitter, has posed a new challenge to researchers, and it is nothing but spam. numerous different approaches to deal with spam are presented. in this study, we attempt to enhance the accuracy of spam detection by applying one of the latest spam detection techniques and its combination with sentiment analysis. using the word embedding technique, we give the tweet text as input to a convolutional neural network (cnn) architecture, and the output will detect spam text or normal text. simultaneously, by extracting the suitable features in the twitter network and applying machine learning methods to them, we separately calculate the tweeter spam detection. eventually, we enter the output of both approaches into a meta classifier so that its output specifies the final spam detection or the normality of the tweet text. in this study, we employ both balanced and unbalanced datasets to examine the impact of the proposed model on two types of data. the results indicate an increase in the accuracy of the proposed method in both datasets.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved