|
|
ملاکهای برچسبگذاری استعاره: گامی بهسوی ساخت پیکرهی استعاره
|
|
|
|
|
نویسنده
|
میری محمدسعید
|
منبع
|
زبان پژوهي - 1402 - دوره : 15 - شماره : 47 - صفحه:263 -293
|
چکیده
|
فهم معنای زبانِ انسان برای ماشین همواره با چالشهایی رو به رو است. استعاره نیز یکی از موضوعهای دشوار در پردازش معنایی است. درک استعاره در ارتقا و توسعه فعالیتهای حوزه پردازش زبان طبیعی اهمیت فراوانی دارد. مقاله حاضر به معرفی روشی برای شناسایی استعارهها در زبان فارسی میپردازد. هدف این مقاله، پیشنهادِ شیوهنامهای است که به کمک آن بتوان پیکرهای برای استعارههای فارسی تدوین کرد. برای انجام چنین کاری نیاز است که ملاکهایی برای شناسایی و برچسبگذاری استعاره معرفی شود. روال شناسایی استعارهی دانشگاه آزاد آمستردام (ام.آی.پی.وی.یو) میتواند انواع استعاره را شناسایی کند و در ساخت پیکره استعاره نیز از آن میتوان بهره برد. مبنای مقاله حاضر نیز همین روال شناسایی است. بهرهگیری از این روال از دو جهت مفید است: نخست، به کمک این روال میتوان پیکرهای از استعارههای فارسی تهیه کرد، دوم، به پژوهشگران حوزه استعاره، به ویژه زبانشناسان پیکرهای، کمک میکند که با روایی و پایایی مطلوبی استعارههای فارسی را تحلیل کنند. لازم به گفتن است که برای آزمودن کارآیی روال پیشنهادی، پیکرهای از دادههای فارسی (متون خبری و دانشگاهی) گردآوری و توسط سه کارشناس برچسبگذاری شده و یافتههای مطلوبی (ضریب کاپای 0.964) به دست آمدهاست که در پژوهشی جداگانه به آن خواهیم پرداخت.
|
کلیدواژه
|
استعاره، زبانشناسی پیکرهای، پیکره استعارهی فارسی، شناسایی استعاره، روال شناسایی استعاره (ام.آی.پی.وی.یو)
|
آدرس
|
دانشگاه علامه طباطبائی, گروه زبانشناسی همگانی, ایران
|
پست الکترونیکی
|
ms_miri@outlook.com
|
|
|
|
|
|
|
|
|
metaphor annotation criteria: a step towards building a metaphor corpus
|
|
|
Authors
|
miri mohammad saeid
|
Abstract
|
due to the development of smart devices, the ability of computers to understand human language has become a key issue in technology. by learning and analyzing machine-readable, annotated linguistic data, computers are able to comprehend human language (corpus). corpora plays a crucial role in helping computers comprehend human language. metaphor is one of the most complicated linguistic data that computers cannot comprehend. despite the prevalence of metaphor in everyday language use and the importance of identifying it, no corpus has been published for persian yet. compiling a corpus of persian metaphors is the initial step in learning metaphors for computers.to compile a corpus of persian metaphors, it is necessary to meet two main criteria. deciding the best definition is the first prerequisite. the best definition is both comprehensive and applicable; comprehensive in the sense that it covers a significant proportion of metaphorical instances, and applicable in the sense that it could be used to build a corpus. the second requirement is the construction of a method for metaphor identification. without a straightforward data annotation method, it is impossible to identify metaphors.
|
|
|
|
|
|
|
|
|
|
|
|
|