|
|
رتبه بندی ویژگیها در تشخیص نظرات اسپم فارسی
|
|
|
|
|
نویسنده
|
صفریان نشاط ,بصیری محمد احسان ,خسروی هادی
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1398 - دوره : 8 - شماره : 2 - صفحه:1 -16
|
|
|
چکیده
|
یکی از عوامل اصلی در تصمیمگیری مشتریان برای خرید یک محصول یا استفاده از خدماتی خاص، استفاده از نظرات برخط است. اینگونه از نظرات منابعی ارزشمند از اطلاعات هستند که برای تشخیص افکار عمومی در مورد محصول یا خدمات استفاده میشوند. اگرچه نظرات برخط میتوانند مفید باشند اما اعتماد کورکورانه به آنها، هم برای فروشنده و هم برای خریدار خطرناک است زیرا ممکن است برای بهدست آوردن سود، دستکاری شده باشند که اصطلاحاً به این گونه نظرات « نظرات اسپم» گفته میشود. پژوهش حاضر روی نظرات فارسی ثبتشده در مورد تلفن همراه در وبسایت دیجیکالا انجام شده و از میان انواع اسپم، اسپم نوع یک و دو بررسی شدهاند که نوع اول نظرات جعلی و نوع دوم نظراتی هستند که تنها در رابطه با مدل کالا نوشته شدهاند. ویژگیهای مورد استفاده در این پژوهش به علت کارا بودن آنها در دستهبندی، شامل ویژگیهای مبتنی بر نظر و ویژگیهای فراداده است. این ویژگیها و نیز ترکیبهای متفاوت از آنها در تشخیص نظرات اسپم فارسی و تاثیر آنها روی دقت دستهبند بررسی شده است. دستهبندی توسط درخت تصمیم، دستهبند ماشین بردار پشتیبان و دستهبند نایو بیز انجام شده و در نهایت دقت آنها روی ترکیبهای مختلف این ویژگیها با هم مقایسه گردیده است. بالاترین میزان دقت بهدست آمده از سه دستهبند توسط درخت تصمیم حاصل میشود که برابر با با 0.778 براساس معیار اِف است. در رتبهدهی به ویژگیها باز هم درخت تصمیم با دقت 0.824 و با ترکیب سه ویژگی بازخوردهای مثبت، امتیاز کلی کالا و قطبیت نظر رتبهی برتر را به خود اختصاص میدهد.
|
کلیدواژه
|
نظرات اسپم فارسی ,نظرات جعلی ,نظرکاوی ,تحلیل احساسات ,دستهبندی متن ,رتبهبندی ویژگیها
|
آدرس
|
موسسه آموزش عالی صفاهان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه شهرکرد, دانشکده فنی و مهندسی, ایران, دانشگاه شهرکرد, دانشکده فنی و مهندسی, ایران
|
پست الکترونیکی
|
hosravi@sku.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|