>
Fa   |   Ar   |   En
   نظرکاوی افزایشی با استفاده از یادگیری فعال بر روی جریان متون  
   
نویسنده نوربهبهانی فخرالدین
منبع مهندسي برق و مهندسي كامپيوتر ايران - 1397 - دوره : 16 - شماره : 4 - صفحه:291 -300
چکیده    نظرکاوی امروزه به عنوان یکی از کاربردهای پراهمیت پردازش زبان طبیعی مطرح است که به دلیل بالابودن حجم و نرخ نظرات تولیدشده نیاز به روش‌های ویژه‌ای برای پردازش دارد. امروزه با توجه به ماهیت جریان داده‌ای نظرات کاربران در شبکه‌‌های اجتماعی و سایت‌های تجارت الکترونیکی، استفاده از الگوریتم‌های دسته‌بندی غیر افزایشی باعث می‌گردد به مرور زمان کارایی مدل یادگرفته‌شده برای کاوش نظرات کاهش یافته و عملاً غیر قابل استفاده شود. علاوه بر این به دلیل نامحدودبودن تعداد نظرات، امکان برچسب‌گذاری تمام نظرات برای ایجاد نمونه‌های آموزشی جدید و به روزرسانی مدل یادگرفته‌شده وجود ندارد. از آنجا که ممکن است نظرات جدید دارای واژگان جدید بوده و یا توزیع دسته‌های قطبیت تغییر کند، رانش مفهوم نیز می‌بایست در نظرکاوی افزایشی پشتیبانی گردد.در این مقاله یک روش جدید برای یادگیری قطبیت متون به صورت افزایشی ارائه می‌گردد که با استفاده از یادگیری فعال جریان‌ داده‌ای، متون ارزشمند برای به‌روز رسانی مدل دسته‌بندی را انتخاب می‌کند و پس از تعیین برچسب آنها توسط متخصص انسانی، از آنها برای بهبود مدل دسته‌بندی بهره می‌گیرد. روش پیشنهادی به صورت برخط و بدون نیاز به ذخیره متون، با استفاده از تعداد محدودی متون برچسب‌خورده آموزش می‌بیند و قادر به تشخیص و پشتیبانی از رانش مفهوم می‌باشد. روش پیشنهادی با روش‌های شاخص افزایشی و غیر افزایشی، با استفاده از مجموعه داده‌های معتبر و معیارهای ارزیابی استاندارد مقایسه و ارزیابی می‌شود.
کلیدواژه جریان داده‌ها، رانش مفهوم، نظرکاوی، یادگیری افزایشی، یادگیری فعال
آدرس دانشگاه خوانسار, گروه کامپیوتر, ایران
پست الکترونیکی f.noorbehbahani@khansar-cmc.ac.ir
 
   Incremental Opinion Mining Using Active Learning over a Stream of Documents  
   
Authors Noorbehbahani F.
Abstract    Today, opinion mining is one the most important applications of natural language processing which requires special methods to process documents due to the high volume of comments produced. Since the users’ opinions on social networks and ecommerce websites constitute an evolving stream, the application of traditional nonincremental classification algorithm for opinion mining leads to the degradation of the classification model as time passes. Moreover, because the users’ comments are massive, it is not possible to label enough comments to build training data for updating the learned model. Another issue in incremental opinion mining is the concept drift that should be supported to handle changing class distributions and evolving vocabulary. In this paper, a new incremental method for polarity detection is proposed which with the application of streambased active learning selects the best documents to be labeled by experts and updates the classifier. The proposed method is capable of detecting and handling concept drift using a limited labeled data without storing the documents. We compare our method with the state of the art incremental and nonincremental classification methods using credible datasets and standard evaluation measures. The evaluation results show the effectiveness of the proposed method for polarity detection of opinions.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved