>
Fa   |   Ar   |   En
   رتبه‏ بندی ویژگی‏‌ها در تشخیص نظرات اسپم فارسی  
   
نویسنده صفریان نشاط ,بصیری محمد احسان ,خسروی هادی
منبع رايانش نرم و فناوري اطلاعات - 1398 - دوره : 8 - شماره : 2 - صفحه:1 -16
چکیده    یکی از عوامل اصلی در تصمیم‌گیری مشتریان برای خرید یک محصول یا استفاده از خدماتی خاص، استفاده از نظرات برخط است. این‌گونه از نظرات منابعی ارزشمند از اطلاعات هستند که برای تشخیص افکار عمومی در مورد محصول یا خدمات استفاده می‏شوند. اگرچه نظرات برخط می‌توانند مفید باشند اما اعتماد کورکورانه به آن‏ها، هم برای فروشنده و هم برای خریدار خطرناک است زیرا ممکن است برای به‌دست آوردن سود، دستکاری شده باشند که اصطلاحاً به این گونه نظرات « نظرات اسپم» گفته می‌شود. پژوهش حاضر روی نظرات فارسی ثبت‌شده در مورد تلفن همراه در وب‌سایت دیجی‌کالا انجام شده و از میان انواع اسپم، اسپم نوع یک و دو بررسی شده‌اند که نوع اول نظرات جعلی و نوع دوم نظراتی هستند که تنها در رابطه با مدل کالا نوشته شده‏اند. ویژگی‌های مورد استفاده در این پژوهش به علت کارا بودن آن‏ها در دسته‌بندی، شامل ویژگی‌های مبتنی بر نظر و ویژگی‌های فراداده است. این ویژگی‌ها و نیز ترکیب‌های متفاوت از آن‏ها در تشخیص نظرات اسپم فارسی و تاثیر آن‏ها روی دقت دسته‌بند بررسی شده ‌است. دسته‌بندی توسط درخت تصمیم، دسته‌بند ماشین بردار پشتیبان و دسته‌بند نایو بیز انجام شده و در نهایت دقت آن‏ها روی ترکیب‌های مختلف این ویژگی‌ها با هم مقایسه گردیده است. بالاترین میزان دقت به‌دست آمده از سه دسته‌بند توسط درخت تصمیم حاصل می‏شود که برابر با با 0.778 براساس معیار اِف است. در رتبه‎دهی به ویژ‌گی‌ها باز هم درخت تصمیم با دقت 0.824 و با ترکیب سه ویژگی بازخوردهای مثبت، امتیاز کلی کالا و قطبیت نظر رتبه‌ی برتر را به خود اختصاص می‌دهد.
کلیدواژه نظرات اسپم فارسی ,نظرات جعلی ,نظرکاوی ,تحلیل احساسات ,دسته‏بندی متن ,رتبه‌بندی ویژگی‌ها
آدرس موسسه آموزش عالی صفاهان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه شهرکرد, دانشکده فنی و مهندسی, ایران, دانشگاه شهرکرد, دانشکده فنی و مهندسی, ایران
پست الکترونیکی hosravi@sku.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved