|
|
عقیدهکاوی در زبان فارسی مبتنی بر یادگیری انتقالی
|
|
|
|
|
نویسنده
|
دهقانی اشکذری سعید ,درهمی ولی ,زارع بیدکی علی محمد ,بصیری محمداحسان
|
منبع
|
مهندسي برق دانشگاه تبريز - 1399 - دوره : 50 - شماره : 3 - صفحه:1215 -1224
|
چکیده
|
در دهه گذشته بررسی عقاید، احساسات و هم چنین گرایش های انسانها نقش موثری در تصمیم گیری مدیران و افراد داشته است. الگوریتم های یادگیری ماشین نقش مهمی در زمینه عقیده کاوی دارند، اما از یک مشکل بزرگ رنج می برند: اغلب الگوریتم های یادگیری ماشین فرض می کنند که ابعاد ویژگی و توزیع داده ها یکسان است، اما بسیاری از کاربردهای واقعی از این فرضیات تبعیت نمی کنند. در واقع، داده هایی که الگوریتم در آینده دریافت می کند ممکن است دارای ابعاد و ویژگی متفاوت و یا از توزیع دیگری باشند. در این مقاله با استفاده از یادگیری انتقالی و با تاکید بر انتقال ویژگی، روشی نوین را برای بهبود استخراج احساسات و مفاهیم موجود در عقاید ارائه میدهیم. در روش پیشنهادی، ابتدا ویژگی یا موضوع عقاید در دامنه زبانی مبدا شناسایی شده و با جمع آوری صفات، قیدها و بهطورکلی بسته ای از احتمالاتی که ممکن است برای یک ویژگی رخ دهد و ترجمه آن به زبان مقصد، یادگیری از زبان مبدا به زبان مقصد انتقال می یابد. بررسی روش پیشنهادی روی داده های موجود در فروشگاه اینترنتی آمازون بهعنوان دامنه مبدا نشان می دهد با ایجاد الگوی انتقال ویژگی روی عقاید به زبان انگلیسی، می توان قطبیت موجود در 77 درصد نظرات که به زبان فارسی ثبت شده (در فروشگاه دیجی کالا) را کشف نمود که نسبت به روش های scl، sfa و tca به ترتیب 9، 5 و 5 درصد افزایش بازدهی را نشان می دهد.
|
کلیدواژه
|
عقیدهکاوی، یادگیری انتقالی، انتقال ویژگی، قطبیت
|
آدرس
|
دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی کامپیوتر, ایران, دانشگاه شهرکرد, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
basiri@sku.ac.ir
|
|
|
|
|
|
|
|
|
Persian Opinion Mining based on Transfer Learning
|
|
|
Authors
|
Dehghani S. ,Derhami V. ,Zare Bidoki A. M. ,Basiri M. E.
|
Abstract
|
In the past decade, the study of human opinions, feelings and tendencies has been very effective in the decisionmaking of managers and individuals. Machine learning algorithms play an important role in the field of opinion mining, but they suffer from a big problem: most of the machine learning algorithms assume that the feature dimensions and data distribution are equal, but most of realworld applications don’t follow these assumptions. In fact, the data that the algorithm will receive in the future may have different dimensions or distributions. In this article, a new method for improving sentiment analysis of opinions is proposed by the aid of featurebased transfer learning. In the proposed method, initially, the feature or topic of the opinion in the source language domain is identified. Then, by collecting adjectives, adverbs and totally a package of probabilities about that feature and by translating it into the target language, learning from the source language is transferred into the target language. An analysis of the proposed method on the data available at the Amazon store as the source domain indicates that by creating a pattern of feature transferring in English, the polarity of 77% of the opinions in Persian (recorded at the Digikala store) can be extracted that outperforms the SCL, SFA and TCA models with 9, 5 and 5 percent respectively.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|