نظرکاوی بینزبانی با استفاده از ویژگیهای معنایی
|
|
|
|
|
نویسنده
|
اسمعیلی تفت شیما ,شاکری آزاده
|
منبع
|
علوم رايانش و فناوري اطلاعات - 1394 - دوره : 13 - شماره : 2 - صفحه:47 -59
|
چکیده
|
نظرکاوی یکی از زیربخشهای متنکاوی است. در این حوزه به بررسی متنهای نظرمند پرداخته میشود و هدف تشخیص مثبت و یا منفی بودن مفهوم این متنها است. روشها و راهحلهای پیشنهادی در این حوزه به دو دسته باناظر و بدون ناظر دستهبندی میشود. از آنجا که روشهای باناظر کارایی و دقت بالاتری نسبت به روشهای بدون ناظر دارد، سعی میشود تا آنجایی که امکان دارد شرایط برای استفاده از روشهای باناظر فراهم شود. اصلیترین نیازمندی این روشها، دادههای برچسبخورده، به عنوان داده آموزش، در دامنه و زبان دادههای آزمون است. وجود چنین دادههایی در تمام جفت دامنه و زبانها محدودیتی برای استفاده از این گونه روشها محسوب میشود. با توجه به زمانبر و پرهزینه بودن تولید دادههای برچسبخورده به عنوان دادههای آموزش، معمولاً ایجاد چنین مجموعه دادهای به عنوان بهترین راهحل در نظر گرفته نمیشود. همچنین به دلیل بیان متفاوتی که در دامنهها و زبانهای متفاوت وجود دارد، استفاده از دادههای آموزش موجود در دامنه و یا زبان متفاوت به طور مستقیم موجب کاهش کارایی روشها میشود. اما وجود دادههای آموزش در اکثر دامنهها در زبانهای با منابع غنی انگیزهای برای استفاده غیرمستقیم از این دادهها برای نظرکاوی دادههای آزمون در زبانهای دیگر ایجاد میکند. از این رو روشهایی به عنوان روشهای بینزبانی ارائه شد که در آنها از دادههای آموزش موجود در زبان متفاوت با دادههای آزمون، برای استخراج اطلاعات و در نهایت انتقال اطلاعات به زبان مورد نظر، بهره میبرد. در این مقاله روشی برای نظرکاوی بینزبانی ارائه میشود که این استخراج و انتقال اطلاعات با کیفیت بالایی انجام میشود و همچنین برای اکثر زبانها، حتی زبانهای منابعمحدود نیز قابل استفاده میباشد و به منابع موجود در زبان مورد نظر وابستگی کمی دارد. این روش با استفاده از دادههای بدون برچسب در هر دو زبان مبدا و مقصد، یک گراف دوبخشی بین دو دسته از ویژگیهای محوری و غیرمحوری میسازد و ویژگیهای معنایی را از آن استخراج میکند. تنها منبع مورد نیاز برای این روش، یک لغتنامه است که به دلیل استفاده از تعداد محدودی از ترجمههای آن، میزان وابستگی بالایی به این منبع ندارد.
|
کلیدواژه
|
نظرکاوی، تحلیل نظرات، ویژگی محوری، ویژگی معنایی، بین زبانی، ویژگی مستقل از دامنه، ویژگی وابسته به دامنه، گراف دو بخشی، رده بندی
|
آدرس
|
داﻧﺸﮕﺎه ﺗﻬﺮان, داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ, ایران, داﻧﺸﮕﺎه ﺗﻬﺮان, داﻧﺸﻜﺪه ﻣﻬﻨﺪﺳﻲ ﺑﺮق و ﻛﺎﻣﭙﻴﻮﺗﺮ, ایران
|
|
|
|
|
|
|