|
|
ساخت اضافه در زبان فارسی: بررسی پیکرهبنیاد
|
|
|
|
|
نویسنده
|
نساجیان مینو ,شجاعی راضیه ,بحرانی محمد
|
منبع
|
پژوهش هاي زباني - 1398 - دوره : 10 - شماره : 1 - صفحه:161 -182
|
چکیده
|
ساخت اضافه همواره در نظریههای مختلف زبانشناسی نظیر آوایی، ساختواژی و نحوی حائز اهمیت بوده است و زبانشناسان ایرانی تاکنون تحلیلهای متفاوتی از این ساخت به دست دادهاند. عدم تظاهر کسرۀ اضافه در نوشتار، ابهامات بسیاری را در تحلیل و درک متون فارسی موجب شده است و برنامههای مختلف پردازش زبان اعم از برچسبزن اجزای کلام، تشخیص موجودیتهای ناممند، تشخیص کلمات هممرجع، تبدیل متن به گفتار، ترجمه ماشینی، تجزیه نحوی جملات و غیره را با چالشهای بسیاری روبرو ساخته است. به همین روی، شناسایی جایگاه این عنصر از مهمترین چالشهای پردازش متون زبان فارسی بهشمار میرود. پژوهش حاضر میکوشد تا به شیوهای تحلیلی و پیکرهبنیاد و از منظر دستور وابستگی به بررسی ساخت اضافه بپردازد. از آنجا که دستور وابستگی به لحاظ سادگی، استفاده کم از فضای حافظه رایانه و تسریع در امر پردازش در مطالعات پردازش متن در حوزه زبانشناسی رایانشی از اهمیت چشمگیری برخوردار است، بهترین پایگاه نظری را برای این دست مطالعات فراهم میآورد. به همین سبب، پژوهش حاضر در تلاش است تا با استفاده از این دستور روشی قاعدهمند جهت تشخیص کلمات حاوی نشانۀ کسرۀ اضافه در متون فارسی ارائه دهد. بدین منظور، با ارائه کلیه ساختهای نمونهای که حاوی نشانه اضافه هستند و از پیکره وابستگی زبان فارسی دانشگاه اوپسالا استخراج شدهاند، در چارچوب دستور وابستگی به تجزیه و تحلیل آنها خواهیم پرداخت. از رهگذر این بررسی، تنها هفت قاعدۀ منطقی برای درج کسرۀ اضافه در گروههای غیرفعلی اعم از گروههای اسمی، صفتی، حرف اضافهای، قیدی، گروههایی با بیش از یک وابسته پسین، گروههایی با بیش از یک وابسته از نوع گروه و ساختهای همپایه استخراج میشود که با استناد به آنها میتوان در انواع پیکرههای وابستگی و سامانههای رایانهای مبتنی بر تجزیه وابستگی به شناسایی جایگاه نشانۀ اضافه پرداخت. افزون بر این، در این پژوهش به جایگاههای نشانه اضافهای نیز اشاره خواهد شد که تاکنون در پژوهشهای نظری و رایانهای پیشین به آنها پرداخته نشده است.
|
کلیدواژه
|
نشانۀ اضافه، ساخت اضافه، دستور وابستگی، قواعد درج اضافه، پردازش متن فارسی
|
آدرس
|
دانشگاه صنعتی شریف, مرکز زبانها و زبانشناسی, ایران, دانشگاه تهران, ایران, دانشگاه علامه طباطبائی, گروه علوم رایانه, ایران
|
پست الکترونیکی
|
bahrani@atu.ac.ir
|
|
|
|
|
|
|
|
|
The CorpusBased Study of Ezafe Construction in Persian
|
|
|
Authors
|
nassajian minoo ,Shojaei Razieh ,Bahrani Mohammad
|
Abstract
|
Ezafe construction is considered as one of the most important issues in various linguistic theories including phonetics, morphology and syntax and many Iranian linguists have analyzed this phenomenon from these different aspects. Ezafe marker is usually not written in Persian text. So, not only does it result in a high degree of ambiguity in reading, analyzing, and understanding Persian documents, but also it causes serious difficulties for a large number of natural language processing tasks (NLP) such as partofspeech (POS) tagging, NamedEntity Recognition (NER), Coreference Resolution, Converting Text to Speech, Machine Translation, syntactic parsing and so on. As a result, determining the positions of Ezafe in a given sentence is viewed as a controversial and challenging issue especially in these applications. Using a corpusbased analysis and dependency grammar, the current paper sets to study Ezafe positions. Due to the fact that dependency grammar applies a simple parsing, uses low memory and speeds up computer operations, this grammar is regarded as one of the important and practical grammars in the field of computational linguistics. Accordingly, this study will use a rulebased method within this framework to recognize Ezafe positions. For this purpose, all Ezafe constructions which are provided in Uppsala Persian Dependency Corpus (UPDC) are analyzed based on dependency relations. In the next step, only seven Ezafe rules are formulated consisting of such nonverbal phrases as noun phrases, adjective phrases, prepositional phrases, adverb phrases, phrases with more than one postmodifier, phrases with more than one postmodifier as a phrase and coordinations. The proposed rules can be used in Persian dependency corpora and a great number of language processing tasks which are based on dependency relations. In addition, in the present research, Ezafe positions which have not been mentioned in previous theoretical and computational studies will be elaborated.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|