|
|
ارائه چارچوبی جامع از ویژگیهای موثر در تشخیص اخبار جعلی: یک مرور نظاممند
|
|
|
|
|
نویسنده
|
مظاهری الهام ,مهرآیین محمد ,کاظمی مصطفی ,غیاثی شیرازی کمالالدین
|
منبع
|
پژوهشنامه پردازش و مديريت اطلاعات - 1402 - دوره : 39 - شماره : 2 - صفحه:477 -502
|
چکیده
|
در سالهای اخیر، با توسعه سریع و افزایش محبوبیت رسانههای اجتماعی، شاهد رشد گستردهای در حجم و تنوع اخبار جعلی بودهایم. این پدیده اثرات عمیقی بر روی افراد و جامعه دارد. راستیآزمایی روشی است که بهطوری گسترده برای مقابله با اثرات منفی انتشار اخبار جعلی استفاده میشود. اما این روش هنگام تحلیل حجم عظیم اطلاعات کارآمد نیست. بنابراین از مدلهای پیشرفته یادگیری ماشین و رویکردهای مبتنی بر ویژگی برای شناسایی خودکار اخبار جعلی استفاده میشود. در همان حال، تعداد زیاد مدلها و ناهمگونی ویژگیهای مورد استفاده در ادبیات، اغلب محدودیتهایی برای محققانی که سعی در بهبود عملکرد مدل دارند، ایجاد میکند. به همین دلیل، در مطالعه حاضر با روش مرور نظاممند، چارچوبی جامع از ویژگیهایی که در تشخیص اخبار جعلی استفاده میشوند، ارائه شده است. بهمنظور انجام این مرور نظاممند با استفاده از راهنمای ارائهشده توسط «اوکولی» و «اسچابرام»، کلیه مطالعات انجامگرفته در حوزه اخبار جعلی با استفاده از کلیدواژههای مرتبط، از پایگاه دادههای sciencedirect، springer، emerald، ieee، acm، wiley، sage، jstor، taylor و wos استخراج شد و سرانجام، تعداد 72 مقاله مرتبط مورد بررسی قرار گرفت. در نتیجه تحلیل مقالات مرتبط، ویژگیها در دو طبقه اصلی محتوای خبر و زمینه خبر قرار گرفتند. محتوای خبر شامل ویژگیهای زبانی و معنایی، ویژگیهای بصری و ویژگیهای مبتنی بر سبک هستند. زمینه خبر نیز شامل ویژگیهای مبتنی بر کاربر، پست و شبکه است. نتایج بهدستآمده نشان داد که پرکاربردترین ویژگیها در تشخیص اخبار جعلی ویژگیهای مبتنی بر پروفایل کاربر، ویژگیهای سبک آماری، الگوی نوشتاری و خوانایی هستند. با توجه به تنوع بالای ویژگیهای موجود پیشنهاد میشود ارزیابی گستردهای از ویژگیها، مدلها و همچنین عملکرد آنها در مجموعه دادههای متعدد انجام شود و از این طریق عملکرد مدلها و مجموعه ویژگیهای مختلف مقایسه شود تا بهترین ترکیب ویژگی در شرایط مختلف مشخص گردد.
|
کلیدواژه
|
اخبار جعلی، ویژگی، ویژگیهای مبتنی بر محتوا، ویژگیهای مبتنی بر زمینه اجتماعی، مرور نظاممند
|
آدرس
|
دانشگاه فردوسی مشهد, ایران, دانشگاه فردوسی مشهد, گروه مدیریت, ایران, دانشگاه فردوسی مشهد, گروه مدیریت, ایران, دانشگاه فردوسی مشهد, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
k.ghiasi@um.ac.ir
|
|
|
|
|
|
|
|
|
presenting a comprehensive framework of effective features in fake news detection: a systematic review
|
|
|
Authors
|
mazaheri elham ,mehraeen mohammad ,kazemi mostafa ,ghiasi shirazi kamaledin
|
Abstract
|
over recent years, with the rapid development and increasing popularity of social media, we have seen a massive growth in the volume and variety of fake news. this phenomenon has profound effects on individuals and society. verification is a widely used method to counter the negative effects of fake news. but this method is not efficient when analyzing huge amount of data. therefore, advanced machine learning models and feature-based approaches are used to automatically identify fake news. at the same time, the large number of models and the heterogeneity of features used in the literature often create limitations for researchers trying to improve model performance. for this reason, in the present study a comprehensive framework of the features used in the detection of fake news is presented with a systematic review method. in order to carry out this systematic review, using the guide provided by okoli and schabram, all studies conducted in the field of fake news using related keywords were taken from sciencedirect, springer, emerald, ieee, acm, wiley, sage databases, jstor, taylor and wos and finally 72 related articles were analyzed. as a result of the analysis of related articles, the features were placed in two main categories of news content and news context. news content includes linguistic and semantic features, visual features and style-based features. the news context also includes features based on user, post and network. the obtained results showed that the most used features in detecting fake news are features based on user profile, features of statistical stylistic, writing pattern and readability. due to the high variety of available features, it is suggested that a wide evaluation of features, models and their performance in multiple data sets should be done and in this way the performance of different models and feature sets should be compared in order to find the best combination of features in different conditions to be determined.
|
Keywords
|
fake news ,feature ,content-based features ,social context-based features ,systematic review
|
|
|
|
|
|
|
|
|
|
|