|
|
نظرکاوی افزایشی با استفاده از یادگیری فعال بر روی جریان متون
|
|
|
|
|
نویسنده
|
نوربهبهانی فخرالدین
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1397 - دوره : 16 - شماره : 4 - صفحه:291 -300
|
چکیده
|
نظرکاوی امروزه به عنوان یکی از کاربردهای پراهمیت پردازش زبان طبیعی مطرح است که به دلیل بالابودن حجم و نرخ نظرات تولیدشده نیاز به روشهای ویژهای برای پردازش دارد. امروزه با توجه به ماهیت جریان دادهای نظرات کاربران در شبکههای اجتماعی و سایتهای تجارت الکترونیکی، استفاده از الگوریتمهای دستهبندی غیر افزایشی باعث میگردد به مرور زمان کارایی مدل یادگرفتهشده برای کاوش نظرات کاهش یافته و عملاً غیر قابل استفاده شود. علاوه بر این به دلیل نامحدودبودن تعداد نظرات، امکان برچسبگذاری تمام نظرات برای ایجاد نمونههای آموزشی جدید و به روزرسانی مدل یادگرفتهشده وجود ندارد. از آنجا که ممکن است نظرات جدید دارای واژگان جدید بوده و یا توزیع دستههای قطبیت تغییر کند، رانش مفهوم نیز میبایست در نظرکاوی افزایشی پشتیبانی گردد.در این مقاله یک روش جدید برای یادگیری قطبیت متون به صورت افزایشی ارائه میگردد که با استفاده از یادگیری فعال جریان دادهای، متون ارزشمند برای بهروز رسانی مدل دستهبندی را انتخاب میکند و پس از تعیین برچسب آنها توسط متخصص انسانی، از آنها برای بهبود مدل دستهبندی بهره میگیرد. روش پیشنهادی به صورت برخط و بدون نیاز به ذخیره متون، با استفاده از تعداد محدودی متون برچسبخورده آموزش میبیند و قادر به تشخیص و پشتیبانی از رانش مفهوم میباشد. روش پیشنهادی با روشهای شاخص افزایشی و غیر افزایشی، با استفاده از مجموعه دادههای معتبر و معیارهای ارزیابی استاندارد مقایسه و ارزیابی میشود.
|
کلیدواژه
|
جریان دادهها، رانش مفهوم، نظرکاوی، یادگیری افزایشی، یادگیری فعال
|
آدرس
|
دانشگاه خوانسار, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
f.noorbehbahani@khansar-cmc.ac.ir
|
|
|
|
|
|
|
|
|
Incremental Opinion Mining Using Active Learning over a Stream of Documents
|
|
|
Authors
|
Noorbehbahani F.
|
Abstract
|
Today, opinion mining is one the most important applications of natural language processing which requires special methods to process documents due to the high volume of comments produced. Since the users’ opinions on social networks and ecommerce websites constitute an evolving stream, the application of traditional nonincremental classification algorithm for opinion mining leads to the degradation of the classification model as time passes. Moreover, because the users’ comments are massive, it is not possible to label enough comments to build training data for updating the learned model. Another issue in incremental opinion mining is the concept drift that should be supported to handle changing class distributions and evolving vocabulary. In this paper, a new incremental method for polarity detection is proposed which with the application of streambased active learning selects the best documents to be labeled by experts and updates the classifier. The proposed method is capable of detecting and handling concept drift using a limited labeled data without storing the documents. We compare our method with the state of the art incremental and nonincremental classification methods using credible datasets and standard evaluation measures. The evaluation results show the effectiveness of the proposed method for polarity detection of opinions.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|