|
|
ارائه رویکرد ترکیبی مبتنی بر یادگیری عمیق و یادگیری ماشین جهت تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
|
|
|
|
|
نویسنده
|
متقی وحید ,اسماعیلی مهدی ,بازایی قاسمعلی ,افشارکاظمی محمدعلی
|
منبع
|
علوم و فنون مديريت اطلاعات - 1401 - دوره : 8 - شماره : 3 - صفحه:283 -316
|
چکیده
|
هدف: اطلاعات غلط یا تایید نشده، دقیقاً مانند اطلاعات دقیق در وب منتشر میشوند. بنابراین، ممکن است ویروسی شوند و بر افکار عمومی و تصمیمات آن تاثیر بگذارند. اخبار جعلی و شایعات به ترتیب محبوبترین اشکال اطلاعات دروغ و تایید نشده را نشان میدهند و برای جلوگیری از تاثیرات چشمگیر آنها باید در اسرع وقت کشف شوند. علاقه به تکنیکهای موثر در شناسایی، در سالهای اخیر بسیار سریع در حال افزایش است. مسئله تشخیص اخبار جعلی به عنوان یک مسئله طبقهبندی در پردازش زبان طبیعی و متنکاوی شناخته میشود و هدف آن تفکیک و تشخیص اخبار جعل از واقعی، در متنهای استخراج شده و بهبود در دقت تشخیص اخبار جعلی است. شبکههای عصبی کانولوشن به عنوان یکی از مهمترین مدلهای یادگیری عمیق دقت بالایی را بر روی این مسائل بدست آوردهاند.این شبکهها شامل مشکلاتی مثل عدم در نظر گرفتن موقعیت کلمات میباشند که مساله مذکور با استفاده از شبکه کپسول برطرف گردیده و جهت حل مشکل پردازش سنگین لایههای تمام متصل و فضای پارامتریک الگوریتمهای xgboost و بهینهسازی ازدحام انبوه ذرات (pso) برای دستیابی به دقت و صحّت بهینه پیشنهاد شده است.روش: مطالعه حاضر پژوهشی کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمعآوری شده و با استفاده از روشهای پاکسازی و پیشپردازش، اطلاعات اضافی حذف و پس از برچسب زدن، اخبار آماده بهکارگیری جهت رویکرد پیشنهادی با استفاده از نرمافزار پایتون و کتابخانههای مربوطه با الگوریتمهای یادگیری ماشین و یادگیری عمیق شد.یافتهها: طی بررسی، آزمایش و تست، برخی از الگوریتمهای یادگیری ماشین دارای قدرت بیشتری در مسائل طبقهبندی بودند، ولی با تغییرات و اعمال روشهای پیشنهادی که در ساختار الگوریتم شبکه کانولوشن و شبکه کپسول صورت گرفت، نتایج بهینه نسبت به الگوریتمهای یادگیری ماشین و سایر الگوریتمهای پایه و الگوریتمهای مورد ارزیابی بدست آمد.نتیجهگیری: راهکارهای پیشنهادی در این تحقیق در مقایسه با رویکردهای الگوریتمهای پایه و یا راهکارهای صورت گرفته جهت حل مشکلات مذکور بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگیها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحّت حدود 96 درصد دست یابد.
|
کلیدواژه
|
پردازش زبان طبیعی، طبقهبندی متن، شبکههای عصبی کپسول، تشخیص اخبار جعل، کرونا ویروس، یادگیری عمیق، یادگیری ماشین، اخبار فارسی
|
آدرس
|
دانشگاه آزاد اسلامی واحد قشم, گروه مدیریت فناوری اطلاعات, ایران, دانشگاه آزاد اسلامی واحد کاشان, گروه علوم کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد تهران مرکز, گروه مدیریت, ایران, دانشگاه آزاد اسلامی واحد تهران مرکز, گروه مدیریت, ایران
|
پست الکترونیکی
|
m_afsharkazemi@iauec.ac.ir
|
|
|
|
|
|
|
|
|
providing a hybrid approach based on deep learning and machine learning to detect fake news - a case study of persian newsin the field of covid-19
|
|
|
Authors
|
mottaghi vahid ,esmaeili mahdi ,bazaee ghasem ali ,afshar kazemi mohammad ali
|
Abstract
|
objectives: false or unconfirmed information is published on the web like accurate information, so it can become viral and influence public opinion and decisions. fake news and gossip show the most popular forms of false and unverified information, respectively, and they should be detected as soon as possible to avoid significant effects interest in effective identification techniques has been increasing in recent years.the problem of detecting fake news is known as a classification problem in natural language processing and text mining, and its purpose is to distinguish fake news from real and extracted texts, and to improve the accuracy of detecting fake news is the main issue of this research. convolutional neural networks, as one of the most important models of deep learning, have gained high accuracy on these issues. these networks include problems such as not considering the position of words, which is solved by using the capsule network, and in order to achieve optimal accuracy, two problems of heavy processing of all connected layers and reducing the parametric space using the algorithm xgboost and particle swarm optimization (pso) algorithm are proposed.methods: this study is an applied research in which about 42,000 persian news from different cities of iran were collected from twitter and using additional methods of cleaning and preprocessing, additional information was removed and after tagging, the news was ready to be used for the proposed approach using python software and related libraries are equipped with machine learning and deep learning algorithms.results: during testing, some machine learning algorithms had more power in classification problems, but with the changes in the structure of the convolutional network and capsul network algorithm, better results were obtained than machine learning algorithms and other similar algorithms.conclusions: the proposed solutions in this research in comparison with the approaches of basic algorithms or solutions to solve the mentioned problems by replacing the optimal classifier and reducing the parametric space, by changing the input has been able to achieve better and more acceptable results than other approaches. and achieve an accuracy of about 96%.
|
Keywords
|
natural language processing ,text classification ,capsule neural networks ,fake news detection ,corona virus fake news
|
|
|
|
|
|
|
|
|
|
|