>
Fa   |   Ar   |   En
   تشخیص خودکار هویت نویسندۀ متن در زبان فارسی بر اساس دستور نقش ‌گرای نظام ‌مند  
   
نویسنده سلطان زاده فاطمه ,میرزایی آزاده ,بحرانی محمد ,مدرس خیابانی شهرام
منبع مطالعات زبان ها و گويش هاي غرب ايران - 1403 - دوره : 12 - شماره : 3 - صفحه:59 -84
چکیده    تشخیص خودکار هویت نویسندۀ متن یکی از مسائل مهم زبان‌ شناسی حقوقی تلقی می‌شود. در پژوهش حاضر تلاش می‌شود کارایی ویژگی‌های مبتنی‌ بر مفاهیم دستور نقش‌گرای نظام‌مند هالیدی (هالیدی و متیسن، 2014) با کارایی واژ‎ه‌های دستوری در تشخیص هویت نویسنده مقایسه شود. به این منظور، در ابتدا، پیکره‌ای از آثار هفت نویسندۀ معاصر ایرانی گردآوری شد. در مرحلۀ دوم، از واژه‌های دستوری استخراج‌شده از پیکره فهرستی تهیه شد؛ به‌علاوه، یک مجموعة واژگان براساس شبکۀ نظام حروف ربط، شبکۀ نظام افزودۀ وجه و شبکۀ نظام افزودۀ نگرشی با استفاده از منابع زبانی تهیه شد. سپس بسامد نسبی واژه‌های دستوری و ویژگی‌های مبتنی‌بر دستور نقش‌گرای نظام‌مند در هر متن محاسبه شد. طبقه‌بند پرسپترون چند لایه، نوعی شبکة عصبی، برای مرحلۀ آموزش سامانه به کار گرفته شد و به دقت مطلوبی در مرحلۀ ارزیابی منجر شد. بررسی نتایج ارزیابی سامانه نشان داد که روش محاسبۀ بسامد واژه‌های دستوری نسبت‌به روش مبتنی‌بر دستور نقش‌گرای نظام‌مند در تشخیص هویت نویسندۀ متون فارسی برتری دارد؛ باوجوداین، هنگامی که ویژگی‌های دستور نقش‌گرای نظام‌مند هالیدی درکنار ویژگی بسامد واژه‌های دستوری به کار روند، کارایی سامانه نسبت‌به حالتی که تنها از ویژگی بسامد واژه‌های دستوری استفاده شود، ارتقا می‌یابد.
کلیدواژه تشخیص هویت نویسنده، زبان‌ شناسی حقوقی، دستور نقش ‌گرای نظام‎مند، واژه‌های دستوری، افزودۀ ربطی، افزودۀ وجه، افزودۀ نگرشی
آدرس دانشگاه علامه طباطبایی, دانشکده ادبیات فارسی و زبان‎ های خارجه, گروه زبان‌ شناسی, ایران, دانشگاه علامه طباطبایی, دانشکده ادبیات فارسی و زبان ‎های خارجه, گروه زبان ‌شناسی, ایران, دانشگاه علامه طباطبایی, دانشکده آمار، ریاضی و رایانه, گروه رایانه, ایران, دانشگاه آزاد اسلامی واحد کرج, گروه آموزش مترجمی زبان انگلیسی, ایران
پست الکترونیکی shmodarress@yahoo.com
 
   automatic recognition of authors identity in persian based on systemic functional grammar  
   
Authors soltanzadeh fatemeh ,mirzaei azadeh ,bahrani mohammad ,modarres khiabani shahram
Abstract    automated author identification is one of the important fields in forensic linguistics. in this study, the effectiveness of systemic functional grammar (halliday & matthiessen, 2014) features in persian authorship attribution was compared with that of function words. first, a corpus composed of documents written by seven contemporary iranian authors was collected. second, a list of function words was extracted from the corpus. moreover, conjunction, modality and comment adjunct system networks were applied to form a lexicon using linguistics resources. then, the relative frequency of function words in addition to systemic functional features were calculated in each document. multilayer perceptron classifier, a type of neural network, was used for learning phase which resulted in a desirable accuracy in evaluation phase. the results of the study showed that using function words method is superior to systemic functional approach alone in persian author identification, however, simultaneous use of the two methods increases the effectiveness in comparison to each alone.
Keywords author identification ,forensic linguistics ,systemic functionalgrammar ,function words ,conjunctive adjunct ,mood adjunct ,comment adjunct
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved