>
Fa   |   Ar   |   En
   ساخت اضافه در زبان فارسی: بررسی پیکره‌بنیاد  
   
نویسنده نساجیان مینو ,شجاعی راضیه ,بحرانی محمد
منبع پژوهش هاي زباني - 1398 - دوره : 10 - شماره : 1 - صفحه:161 -182
چکیده    ساخت اضافه همواره در نظریه‎های مختلف زبان‎شناسی نظیر آوایی، ساختواژی و نحوی حائز اهمیت بوده است و زبان‎شناسان ایرانی تاکنون تحلیل‎های متفاوتی از این ساخت به دست داده‎اند. عدم تظاهر کسرۀ اضافه در نوشتار، ابهامات بسیاری را در تحلیل و درک متون فارسی موجب شده است و برنامه‌های مختلف پردازش زبان اعم از برچسب‌زن اجزای کلام، تشخیص موجودیت‌های نام‌مند، تشخیص کلمات هم‌مرجع، تبدیل متن به گفتار، ترجمه ماشینی، تجزیه نحوی جملات و غیره را با چالش‌های بسیاری روبرو ساخته است. به همین روی، شناسایی جایگاه این عنصر از مهم‎ترین چالش‎های پردازش متون زبان فارسی به‎شمار می‎رود. پژوهش حاضر می‎کوشد تا به شیوه‎ای تحلیلی و پیکره‎بنیاد و از منظر دستور وابستگی به بررسی ساخت اضافه بپردازد. از آنجا که دستور وابستگی به لحاظ سادگی، استفاده کم از فضای حافظه رایانه و تسریع در امر پردازش در مطالعات پردازش متن در حوزه زبان‎شناسی رایانشی از اهمیت چشمگیری برخوردار است، بهترین پایگاه نظری را برای این دست مطالعات فراهم می‌آورد. به همین سبب، پژوهش حاضر در تلاش است تا با استفاده از این دستور روشی قاعده‌مند جهت تشخیص کلمات حاوی نشانۀ کسرۀ اضافه در متون فارسی ارائه دهد. بدین منظور، با ارائه کلیه ساخت‌های نمونه‌ای که حاوی نشانه اضافه هستند و از پیکره وابستگی زبان فارسی دانشگاه اوپسالا استخراج شده‌اند، در چارچوب دستور وابستگی به تجزیه و تحلیل آن‌ها خواهیم پرداخت. از رهگذر این بررسی، تنها هفت قاعدۀ منطقی برای درج کسرۀ اضافه در گروه‌های غیرفعلی اعم از گروه‎های اسمی، صفتی، حرف‎ اضافه‎ای، قیدی، گروه‌هایی با بیش از یک وابسته پسین، گروه‌هایی با بیش از یک وابسته از نوع گروه و ساخت‌های همپایه استخراج می‎شود که با استناد به آن‌ها می‎توان در انواع پیکره‌های وابستگی و سامانه‎های رایانه‎ای مبتنی بر تجزیه وابستگی به شناسایی جایگاه نشانۀ اضافه پرداخت. افزون ‌بر این، در این پژوهش به جایگاه‌های نشانه اضافه‌‌ای نیز اشاره خواهد شد که تاکنون در پژوهش‌های نظری و رایانه‌ای پیشین به‌ آن‌ها پرداخته نشده است.
کلیدواژه نشانۀ اضافه، ساخت اضافه، دستور وابستگی، قواعد درج اضافه، پردازش متن فارسی
آدرس دانشگاه صنعتی شریف, مرکز زبان‌ها و زبان‌شناسی, ایران, دانشگاه تهران, ایران, دانشگاه علامه طباطبائی, گروه علوم رایانه, ایران
پست الکترونیکی bahrani@atu.ac.ir
 
   The CorpusBased Study of Ezafe Construction in Persian  
   
Authors nassajian minoo ,Shojaei Razieh ,Bahrani Mohammad
Abstract    Ezafe construction is considered as one of the most important issues in various linguistic theories including phonetics, morphology and syntax and many Iranian linguists have analyzed this phenomenon from these different aspects. Ezafe marker is usually not written in Persian text. So, not only does it result in a high degree of ambiguity in reading, analyzing, and understanding Persian documents, but also it causes serious difficulties for a large number of natural language processing tasks (NLP) such as partofspeech (POS) tagging, NamedEntity Recognition (NER), Coreference Resolution, Converting Text to Speech, Machine Translation, syntactic parsing and so on. As a result, determining the positions of Ezafe in a given sentence is viewed as a controversial and challenging issue especially in these applications. Using a corpusbased analysis and dependency grammar, the current paper sets to study Ezafe positions. Due to the fact that dependency grammar applies a simple parsing, uses low memory and speeds up computer operations, this grammar is regarded as one of the important and practical grammars in the field of computational linguistics. Accordingly, this study will use a rulebased method within this framework to recognize Ezafe positions. For this purpose, all Ezafe constructions which are provided in Uppsala Persian Dependency Corpus (UPDC) are analyzed based on dependency relations. In the next step, only seven Ezafe rules are formulated consisting of such nonverbal phrases as noun phrases, adjective phrases, prepositional phrases, adverb phrases, phrases with more than one postmodifier, phrases with more than one postmodifier as a phrase and coordinations. The proposed rules can be used in Persian dependency corpora and a great number of language processing tasks which are based on dependency relations. In addition, in the present research, Ezafe positions which have not been mentioned in previous theoretical and computational studies will be elaborated.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved