>
Fa   |   Ar   |   En
   سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب‌های معنایی  
   
نویسنده مظفری زهرا ,تاکی گیتی ,صباغ جعفری مجتبی ,یوسفیان پاکزاد
منبع پژوهش هاي زباني - 1397 - دوره : 9 - شماره : 1 - صفحه:99 -117
چکیده    رفع ابهام معنایی از کلمات در بافت یکی از مهم‌ترین چالش‌ها در حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی است. در این میان حروف اضافه، به‌خصوص در زبان فارسی، در پژوهش‌های مربوط به رفع ابهام معنایی همواره نادیده انگاشته شده‌اند. ازاین‌رو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالب‌های معنایی، سامانه‌ای قاعده‌مند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فارسی ارائه دهد. روش به کار گرفته‌شده در این پژوهش و الگوریتم پیشنهادی منحصربه‌فرد است. دادگان مورداستفاده در این پژوهش شامل 1000 جمله دادۀ آموزشی، 100 جمله دادۀ توسعه و 500 جمله دادۀ تست است که از منابع اینترنتی و شبکه‌های اجتماعی همچون یوتیوب جمع‌آوری گردیده است. جهت انجام کار، تمام حروف اضافه موردنظر پژوهش برچسب‌دهی معنایی شده و برای آن‌ها در پیکرۀ آموزشی، قالب‌های معنایی بر اساس زبان قالب بنیاد مینسکی (1975) تعریف شدند. همچنین برای کلمات قبل و بعد حروف اضافه در پیکره نیز قالب‌هایی تهیه‌ و در فایل داده مدخل‌ها وارد سامانه گردیدند. الگوریتم پژوهش در سه مسیر با استفاده از اطلاعات موجود در قالب‌ها، اقدام به تعیین معنای حروف اضافه در جملات ‌می‌کند. نتایج آزمایش‌های دادۀ تست، نشان‌ دهندۀ دقت بالای عملکرد سامانه (99/16%) در رفع ابهام معنایی از حروف اضافه در زبان فارسی است.
کلیدواژه زبان‌شناسی رایانشی، پردازش زبان طبیعی، سامانۀ رفع ابهام معنایی، حروف اضافه، قالب‌های معنایی
آدرس دانشگاه سیستان و بلوچستان, ایران, دانشگاه سیستان و بلوچستان, ایران, دانشگاه ولی عصر (عج) رفسنجان, گروه مهندسی کامپیوتر, ایران, دانشگاه سیستان و بلوچستان, ایران
 
   Preposition sense disambiguation in Persian using semantic frames  
   
Authors Mozaffari Zahra ,Taki giti ,Sabbagh Jaffari Mojtaba ,Yusefian Pakzad
Abstract    Word sense disambiguation is one of the important challenges in natural language processing (NLP) and computational linguistics. However, preposition sense disambiguation especially, in Persian has been neglected. Therefore, the present study seeks to define an algorithm based on semantic frames to disambiguate the prepositions; «az», «dar», «ba» and «ta» in Persian. The algorithm and its implementation are new in this project. The data includes 1000 sentences as a training corpus, 100 sentences as a developing data and 500 sentences as a test data collected from internet sources and social networks such as YouTube. The mentioned prepositions were sense annotated. Semantic frames based on framebased language (Minsky, 1975) were constructed for the mentioned prepositions in the training corpus and for the words before and after the prepositions included in the entries as a data file. The algorithm in three paths based on the information in the frames assigns a meaning to the prepositions in the sentences. The results indicated the high precision (99.16%) of the system in disambiguating the prepositions in Persian.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved