>
Fa   |   Ar   |   En
   استفاده از یادگیری بانظارت برای شناسایی هرزنظر در زبان فارسی  
   
DOR 20.1001.2.9919046224.1399.6.1.7.2
نویسنده جمشیدی نژاد سپیده ,احمدی آبکناری فاطمه ,بیات پیمان
منبع وب پژوهي - 1399 - دوره : 6 - ششمين کنفرانس بين المللي وب پژوهي - کد همایش: 99190-46224
چکیده    با توجه به استفاده روزافزون از نظرات درج‌شده کاربران در حوزه‌های مختلف در شبکه‌های اجتماعی و ارزشمند بودن این نظرات، صحت آنها بسیار مهم است اما افراد ناشناس بیان‌کننده نظر ممکن است با اهداف مخرب، نظرات جعلی و هرز را برای ترویج یا بی‌اعتبارکردن محصولات، خدمات، سازمان‌ها یا افراد، بیان نمایند. از آنجا که شناسایی هرزنظر تنها با خواندن، دشوار و حتی غیرممکن است یافتن داده‌هایی برای طراحی و ارزیابی الگوریتم‌های شناسایی هرزنظر نیز دشوار خواهد بود. با توجه به چالش مطرح‌شده، مقاله حاضر با نوآوری در ترکیب محتوای نظر، فراداده و اطلاعات موجودیت، مجموعه‌ای از ویژگی‌های داده‌ای را تولید می‌کند و برای اولین بار در سطح سند و جمله، هرزنظر را در زبان فارسی تشخیص می‌دهد. سپس شناسایی هرزنظر به عنوان یک مساله دسته‌بندی، با دو دسته جعلی و غیرجعلی معرفی و با شش روش یادگیری بانظارت، مدلسازی می‌شود. برای ارزیابی نتایج، ضمن محاسبه پارامترهای دقت، فراخوانی و صحت، ماتریس آشفتگی شش روش مدلسازی نیز ساخته شد و با مقایسه پارامترها، دسته‌بند جنگل تصادفی با 98.65%، 97.27% و 99.09% به ترتیب برای دقت، فراخوانی و صحت، به عنوان بهترین و دقیق‌‌ترین دسته‌بند در شناسایی هرزنظر معرفی شد.
کلیدواژه شناسایی هرزنظر ,یادگیری بانظارت ,مدلسازی هرزنظر ,نظرات فارسی.
آدرس دانشگاه آزاد اسلامی واحد رشت, ایران, دانشگاه آزاد اسلامی واحد رشت, ایران, دانشگاه آزاد اسلامی واحد رشت, ایران
پست الکترونیکی bayat@iaurasht.ac.ir
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved