|
|
ارزیابی روشهای یادگیری کلاسیک و یادگیری عمیق در تجزیه و تحلیل احساسات دادههای تلگرام فارسی
|
|
|
|
|
نویسنده
|
زارع مهرجردی فاطمه ,یزدیان دهکردی مهدی ,لطیف علی محمد
|
منبع
|
محاسبات نرم - 1401 - دوره : 11 - شماره : 1 - صفحه:88 -105
|
چکیده
|
امروزه اینترنت و به خصوص شبکههای اجتماعی مانند توییتر، فیسبوک و تلگرام به بستری برای تبادل ایدهها و به اشتراکگذاری نظرات کاربران تبدیل شده است. تجزیه و تحلیل احساسات بر اساس نظرات کاربران در این شبکهها میتواند کمک شایانی در توضیح و پیشبینی پدیدههای اجتماعی و همچنین یافتن محصولات یا خدمات مناسب برای افراد، شرکتها و سازمانها نماید. تاکنون پژوهشهای زیادی بر روی دادههای شبکههای اجتماعی به زبان انگلیسی انجام شده است؛ اما برای زبان فارسی پژوهشهای محدودی انجام شده است. در این مقاله یک سیستم تجزیه و تحلیل احساسات بر روی دادههای تلگرام فارسی پیشنهاد شده است. برای این منظور، چند روش استخراج ویژگی شامل بردار رخداد، فراوانی اصطلاح-معکوس فراوانی سند و ماتریس تعبیه کلمات جهت بازنمایی دادههای متنی به عددی بررسی شده است. سپس جهت طبقهبندی دادهها روشهای مختلف یادگیری ماشین کلاسیک شامل ماشین بردار پشتیبان، درخت تصمیم، k نزدیکترین همسایه، بیز ساده و رگرسیون منطقی، تلفیق روشهای کلاسیک و همچنین روشهای یادگیری عمیق شامل شبکه عصبی عمیق، شبکه عصبی پیچشی و شبکههای حافظه طولانی کوتاه مدت یکطرفه و دوطرفه بررسی شده است. در نهایت ارزیابی و تحلیل نتایج بر روی دادههای جمعآوری شده از تلگرام فارسی نشان میدهد که بهترین کارایی توسط روش استخراج ویژگی ماتریس تعبیه کلمات به همراه شبکه حافظه طولانی کوتاه مدت دوطرفه با دقت 90.67، صحت 90.01، فراخوان 89.54 و معیار f، 89.77 درصد به دست آمده است.
|
کلیدواژه
|
تجزیه و تحلیل احساسات، پیامهای تلگرام، یادگیری ماشین، یادگیری عمیق
|
آدرس
|
دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
alatif@yazd.ac.ir
|
|
|
|
|
|
|
|
|
evaluating classical machine learning and deep-learning methods in sentiment analysis of persian telegram message
|
|
|
Authors
|
zare mehrjardi fatemeh ,yazdian-dehkordi mahdi ,latif alimohammad
|
Abstract
|
today, the internet, especially social networks such as twitter, facebook, and telegram, has become a platform for exchanging ideas and sharing user opinions. sentiment analysis based on user opinions in these networks can help explain and predict social phenomena and find suitable products or services for individuals, companies, and organizations. so far, a lot of research has been done on social media data in english; but limited research has been done for the persian language. in this paper, a sentiment analysis system on persian telegram data is proposed. for this purpose, several feature extraction methods including countvectorizer, tf-idf, and word embedding matrix have been studied to represent textual data numerically. then, to classify the data, different classical machine learning methods including support vector machine, decision tree, k-nearest neighbor, naïve bayes, and logistic regression, the combination of classical methods as well as deep learning methods including deep neural network (dnn), convolutional neural network (cnn), long short-term memory network and bidirectional long short-term memory network has been investigated. finally, the evaluation and analysis of the results on the data collected from persian telegram shows that the best performance has been obtained by word embedding and bidirectional long short-term memory network with an accuracy of 90.67%, precision of 90.01%, recall of 89.54% and f1 of 89.77%.
|
|
|
|
|
|
|
|
|
|
|
|
|