|
|
استفاده از تکنیک رایگیری اکثریت در طبقهبندی اخبار جعلی از واقعی با الگوریتمهای درخت تصمیم،رگرسیون لجستیک و کا-نزدیک ترین همسایگی
|
|
|
|
|
نویسنده
|
وظیفهآبان هادی ,حسنی آهنگر محمدرضا
|
منبع
|
ششمين همايش ملي فناوريهاي نوين در مهندسي برق، كامپيوتر و مكانيك ايران - 1402 - دوره : 6 - ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران - کد همایش: 02221-18264 - صفحه:0 -0
|
چکیده
|
برای طبقهبندی متن از یادگیری ماشین و پردازش زبان طبیعی به طور گستردهای استفاده میشود. به طور کلی هدف یک طبقهبند متن، طبقهبندی سندها در قالب تعداد مشخصی از دستههای از پیش تعیین شده میباشد. در این پژوهش، اخبار پخش شده در فضای مجازی مورد بررسی قرار گرفته است تا به این سوال پاسخ داده شود که این اخبار در کدام یک از دستهی جعلی یا واقعی قرار میگیرد. روش پیشنهادی با در نظر داشتن ساختارکلمات انگلیسی، مدل tf-idf و الگوریتمهای درخت تصمیم،رگرسیون لجستیک و کا-نزدیک ترین همسایگی، اخبار جعلی را از واقعی بااستفاده از تکنیک رایگیری اکثریت طبقهبندی میکند. در این پژوهش سه الگوریتم یادگیری مذکور مورد استفاده قرار گرفت تا یک مدل ترکیبی برای دستهبندی اخبار جعلی از واقعی ایجاد شود. مطابق نتایج و براساس شاخصهای مختلف ازریابی دقت، مدل پیشنهادی دقتی در حدود 88 درصد داشت.
|
کلیدواژه
|
طبقهبندی متن، اخبار جعلی، پردازش زبان طبیعی، متن انگلیسی، رایگیری اکثریت
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
mrhasani@ihu.ac.ir
|
|
|
|
|
|
|
|
|
using the majority voting technique in classifying fake news from real news with decision tree, logistic regression and k-nearest neighbor algorithms.
|
|
|
Authors
|
|
Abstract
|
machine learning and natural language processing are widely used for text classification. in general, the purpose of a text classifier is to classify documents in the form of a certain number of predetermined categories. in this research, the news spread in cyberspace has been examined to answer the question of which category of fake or real this news is. considering the structure of english words, tf-idf model and decision tree, logistic regression and k-nearest neighbor algorithms, the proposed method classifies fake news from real news using majority voting technique. in this research, the three mentioned learning algorithms were used to create a hybrid model for classifying fake news from real news. according to the results and based on various indicators of accuracy, the proposed model had an accuracy of about 88%.
|
Keywords
|
text classification ,fake news ,natural language processing ,english text ,majority voting
|
|
|
|
|
|
|
|
|
|
|