|
|
|
|
تشخیص خودکار هویت نویسندۀ متن در زبان فارسی بر اساس دستور نقش گرای نظام مند
|
|
|
|
|
|
|
|
نویسنده
|
سلطان زاده فاطمه ,میرزایی آزاده ,بحرانی محمد ,مدرس خیابانی شهرام
|
|
منبع
|
مطالعات زبان ها و گويش هاي غرب ايران - 1403 - دوره : 12 - شماره : 3 - صفحه:59 -84
|
|
چکیده
|
تشخیص خودکار هویت نویسندۀ متن یکی از مسائل مهم زبان شناسی حقوقی تلقی میشود. در پژوهش حاضر تلاش میشود کارایی ویژگیهای مبتنی بر مفاهیم دستور نقشگرای نظاممند هالیدی (هالیدی و متیسن، 2014) با کارایی واژههای دستوری در تشخیص هویت نویسنده مقایسه شود. به این منظور، در ابتدا، پیکرهای از آثار هفت نویسندۀ معاصر ایرانی گردآوری شد. در مرحلۀ دوم، از واژههای دستوری استخراجشده از پیکره فهرستی تهیه شد؛ بهعلاوه، یک مجموعة واژگان براساس شبکۀ نظام حروف ربط، شبکۀ نظام افزودۀ وجه و شبکۀ نظام افزودۀ نگرشی با استفاده از منابع زبانی تهیه شد. سپس بسامد نسبی واژههای دستوری و ویژگیهای مبتنیبر دستور نقشگرای نظاممند در هر متن محاسبه شد. طبقهبند پرسپترون چند لایه، نوعی شبکة عصبی، برای مرحلۀ آموزش سامانه به کار گرفته شد و به دقت مطلوبی در مرحلۀ ارزیابی منجر شد. بررسی نتایج ارزیابی سامانه نشان داد که روش محاسبۀ بسامد واژههای دستوری نسبتبه روش مبتنیبر دستور نقشگرای نظاممند در تشخیص هویت نویسندۀ متون فارسی برتری دارد؛ باوجوداین، هنگامی که ویژگیهای دستور نقشگرای نظاممند هالیدی درکنار ویژگی بسامد واژههای دستوری به کار روند، کارایی سامانه نسبتبه حالتی که تنها از ویژگی بسامد واژههای دستوری استفاده شود، ارتقا مییابد.
|
|
کلیدواژه
|
تشخیص هویت نویسنده، زبان شناسی حقوقی، دستور نقش گرای نظاممند، واژههای دستوری، افزودۀ ربطی، افزودۀ وجه، افزودۀ نگرشی
|
|
آدرس
|
دانشگاه علامه طباطبایی, دانشکده ادبیات فارسی و زبان های خارجه, گروه زبان شناسی, ایران, دانشگاه علامه طباطبایی, دانشکده ادبیات فارسی و زبان های خارجه, گروه زبان شناسی, ایران, دانشگاه علامه طباطبایی, دانشکده آمار، ریاضی و رایانه, گروه رایانه, ایران, دانشگاه آزاد اسلامی واحد کرج, گروه آموزش مترجمی زبان انگلیسی, ایران
|
|
پست الکترونیکی
|
shmodarress@yahoo.com
|
|
|
|
|
|
|
|
|
|
|
|
|
automatic recognition of authors identity in persian based on systemic functional grammar
|
|
|
|
|
Authors
|
soltanzadeh fatemeh ,mirzaei azadeh ,bahrani mohammad ,modarres khiabani shahram
|
|
Abstract
|
automated author identification is one of the important fields in forensic linguistics. in this study, the effectiveness of systemic functional grammar (halliday & matthiessen, 2014) features in persian authorship attribution was compared with that of function words. first, a corpus composed of documents written by seven contemporary iranian authors was collected. second, a list of function words was extracted from the corpus. moreover, conjunction, modality and comment adjunct system networks were applied to form a lexicon using linguistics resources. then, the relative frequency of function words in addition to systemic functional features were calculated in each document. multilayer perceptron classifier, a type of neural network, was used for learning phase which resulted in a desirable accuracy in evaluation phase. the results of the study showed that using function words method is superior to systemic functional approach alone in persian author identification, however, simultaneous use of the two methods increases the effectiveness in comparison to each alone.
|
|
Keywords
|
author identification ,forensic linguistics ,systemic functionalgrammar ,function words ,conjunctive adjunct ,mood adjunct ,comment adjunct
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|