|
|
بهبود شناسایی قطبش در تحلیل احساسات به کمک طعنه کاوی و الگوریتم های یادگیری ماشین در توییت های فارسی
|
|
|
|
|
نویسنده
|
حاجی عبداله شقایق ,میرزارضایی میترا ,پدرام میرمحسن
|
منبع
|
فناوري اطلاعات و ارتباطات ايران - 1401 - دوره : 14 - شماره : 53-54 - صفحه:14 -23
|
چکیده
|
تحلیل احساسات یا نظرکاوی شاخه ای از علوم کامپیوتر و پردازش زبان طبیعی است که سعی دارد ماشین و هوش مصنوعی را با احساس و عواطف انسانی آشنا سازد.طعنه کاوی نیز از زیرشاخه های تحلیل احساسات است و هر دو بدنبال تشخیص صحیح احساسات مثبت و منفی نهفته در متن هستند. استفاده از طعنه در شبکه های اجتماعی بسیار مرسوم است، زیرا به این طریق می توان انتقاد را با زبان طنز انجام داد. آشکارسازی طعنه در تشخیص درستی قطبش یک نظر، تاثیر به خصوصی دارد و می تواند به فهم متن توسط ماشین کمک کند و منظور نویسنده متن، شفاف تر فهمیده شود. به این هدف، 8000 توییت فارسی که بر چسب احساس دارند و از لحاظ وجود یا عدم وجود طعنه بررسی شدهاند، مورد استفاده قرار گرفته است. نوآوری این پژوهش در استخراج کلمات کلیدی از جملات طعنه دار است که باعث ایجاد طعنه و کنایه شده اند. در این پژوهش دستهبند مجزایی برای شناسایی طعنه در متن طراحی و اموزش داده شده است و سپس خروجی های این ردهبند به عنوان ویژگی افزوده در اختیار دستهبند شناسایی احساس متن قرار می گیرد. همچنین علاوه بر بقیه کلمات کلیدی استخراج شده از متن از شکلک ها و هشتگ های موجود در متن نیز به عنوان ویژگی استفاده شده است. دستهبندهای بیز، ماشین بردار پشتیبان و شبکه عصبی به عنوان دستهبندهای پایه استفاده شدهاند و در نهایت از ترکیب دستهبندها در شناسایی احساس متن استفاده شد. نتایج این پژوهش نشان میدهد که شناسایی طعنه موجود در متن و استفاده از آن در شناسایی احساس دقت نتایج را افزایش میدهد.
|
کلیدواژه
|
تحلیل احساس، نظرکاوی، طعنه کاوی، توییتر، ترکیب طبقه بندها
|
آدرس
|
دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, گروه مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران, گروه مهندسی کامپیوتر, ایران, دانشگاه خوارزمی, دانشکده فنی و مهندسی, گروه مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
pedram@khu.ac.ir
|
|
|
|
|
|
|
|
|
improving polarity identification in sentiment analysis using sarcasm detection and machine learning algorithms in persian tweets
|
|
|
Authors
|
haji abdullah shagaig ,mirza rezaei mitra ,pedram mir mohsen
|
Abstract
|
sentiment analysis is a branch of computer science and natural language processing that seeks to familiarize machines with human emotions and make them recognizable. both sentiment analysis and sarcasm which is a sub field of the former, seek to correctly identify the hidden positive and negative emotions of the text. the use of sarcasm on social media, where criticism can be exercised within the context of humor, is quite common. detection of sarcasm has a special effect on correctly recognizing the polarization of an opinion, and thus not only it can help the machine to understand the text better, but also makes it possible for the respective author to get his message across more clearly. for this purpose, 8000 persian tweets that have emotional labels and examined for the presence or absence of sarcasm have been used. the innovation of this research is in extracting keywords from sarcastic sentences. in this research, a separate classifier has been trained to identify irony of the text. the output of this classifier is provided as an added feature to the text recognition classifier. in addition to other keywords extracted from the text, emoticons and hashtags have also been used as features. naive bayes, support vector machines, and neural networks were used as baseline classifiers, and finally the combination of classifiers was used to identify the feeling of the text. the results of this study show that identifying the irony in the text and using it to identify emotions increases the accuracy of the results.
|
|
|
|
|
|
|
|
|
|
|
|
|