|
|
ساخت واژگان به صورت خودکار برای تحلیل نظرات در حوزه بورس
|
|
|
|
|
نویسنده
|
آهنگری آهنگرکلائی مرتضی ,سبطی علی ,یعقوبی مهدی
|
منبع
|
پردازش علائم و داده ها - 1402 - شماره : 2 - صفحه:3 -20
|
چکیده
|
با رشد چشمگیر رسانه های اجتماعی، افراد و سازمانها به طور فزایندهای از افکار عمومی در این رسانه ها برای تصمیم گیری خود استفاده میکنند. هدف تحلیل احساسات، استخراج خودکار احساسات افراد از این شبکههای اجتماعی میباشد. شبکههای اجتماعی مرتبط به بازارهای مالی، از جمله بازارهای سهام، اخیرا مورد توجه بسیاری از افراد و سازمانها قرار گرفته است. افراد در این شبکهها نظرات و عقاید خود را در مورد هر سهم در قالب یک پست یا توییت، به اشتراک میگذارند. در واقع تحلیل احساسات در این حوزه، سنجش نگرش افراد به هر سهم است. یکی از رویکردهای پایهای و اصلی در تحلیل خودکار احساسات روشهای مبتنی بر واژگان است. اغلب واژگانهای مرسوم به صورت دستی استخراج شدهاند که فرایندی بسیار دشوار و هزینه بر است. در این مقاله روشی جدید جهت استخراج یک واژگان به صورت خودکار در حوزه شبکههای اجتماعی بورسی ارائه شده است. یک ویژگی خاص این شبکهها، وجود اطلاعات قیمتی هر سهم در هر روز است. با در نظر گرفتن وضعیت قیمتی سهم در روز درج نظر برای آن سهم، واژگانی را برای بهبود کیفیت عقیده کاوی در این شبکهها استخراج نمودیم. برای ارزیابی واژگانهای تولید شده با استفاده از روش پیشنهادی، آن را با نسخه فارسی واژگان sentistrength که با هدف استفاده عمومی طراحی شده است، مقایسه نمودیم. نتایج آزمایشات 20 درصد بهبود را در معیار صحت نسبت به استفاده از واژگان عمومی نشان میدهد.
|
کلیدواژه
|
تحلیل احساسات، عقیده کاوی، ساخت واژگان، واژگان فارسی
|
آدرس
|
دانشگاه گلستان, دانشکده مهندسی گرگان, گروه مهندسی کامپیوتر, ایران, دانشگاه گلستان, دانشکده مهندسی گرگان, گروه مهندسی کامپیوتر, ایران, دانشگاه گلستان, دانشکده مهندسی گرگان, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
m.yaghoubi@gu.ac.ir
|
|
|
|
|
|
|
|
|
automatically generate sentiment lexicon for the persian stock market
|
|
|
Authors
|
ahangari ahangarkolaei morteza ,sebti ali ,yaghoubi mehdi
|
Abstract
|
with the significant growth of social media, individuals and organizations are increasingly using public opinion in these media to make their own decisions. the purpose of sentiment analysis is to automatically extract peoplechr(’39’)s emotions from these social networks. social networks related to financial markets, including stock markets, have recently attracted the attention of many individuals and organizations. people on these social networks share their opinions and ideas about each share in the form of a post or tweet. in fact, sentiment analysis in this area is measuring peoplechr(’39’)s attitudes toward each share. one of the basic approaches in automatic analysis of emotions is lexicon-based methods. most conventional lexicon is manually extracted, which is a very difficult and costly process. in this article, a new method for extracting a lexicon automatically in the field of stock social networks is proposed. a special feature of these networks is the availability of price information per share. taking into account the price information of the share on the day of tweeting for that share, we extracted lexicon to improve the quality of opinion mining in these social networks. to evaluate the lexicon produced using the proposed method, we compared it with the persian version of the sentistrength lexicon, which is designed for general purpose. experimental results show a 20% improvement in accuracy compared to the use of general lexicon.
|
Keywords
|
sentiment analysis ,opinion mining ,lexicon creation ,persian lexicon
|
|
|
|
|
|
|
|
|
|
|