>
Fa   |   Ar   |   En
   رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی lda  
   
نویسنده مسعودی بابک ,راحتی سعید
منبع پردازش علائم و داده ها - 1394 - دوره : 12 - شماره : 4 - صفحه:117 -125
چکیده    ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(lda) برای این منظور استفاده کرده ایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان می دهد که بیان گر موثر بودن این روش در یافتن معنی مناسب واژگان مبهم است.
کلیدواژه تخصیص پنهان دریکله، چند معنایی، رفع ابهام معنایی، مدل سازی موضوع
آدرس دانشگاه پیام نور, گروه مهندسی کامپیوتر و فناوری اطلاعات, ایران, دانشگاه آزاد اسلامی واحد مشهد, ایران
 
   farsi word sense disambiguation with LDA Topic model  
   
Authors rahati ghochani saeid
Abstract    Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet Allocation (LDA) model. The system with a maximum entropy model achieved 97.67% precision for 4 high frequently farsi homograph words
Keywords Latent Dirichlet Allocation(LDA) ,Topic Model ,Maximum Entropy ,Word Sense Disambiguation
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved