ملاک‌های برچسب‌گذاری استعاره: گامی به‌سوی ساخت پیکره‌ی استعاره

Fa | Ar | En

ملاک‌های برچسب‌گذاری استعاره: گامی به‌سوی ساخت پیکره‌ی استعاره


نویسنده	میری محمدسعید
منبع	زبان پژوهي - 1402 - دوره : 15 - شماره : 47 - صفحه:263 -293
چکیده	فهم معنای زبانِ انسان برای ماشین همواره با چالش‌هایی رو به‌ رو است. استعاره نیز یکی از موضوع‌های دشوار در پردازش معنایی است. درک استعاره در ارتقا و توسعه فعالیت‌های حوزه پردازش زبان طبیعی اهمیت فراوانی دارد. مقاله حاضر به معرفی روشی برای شناسایی استعاره‌ها در زبان فارسی می‌پردازد. هدف این مقاله، پیشنهادِ شیوه‌نامه‌ای است که به کمک آن بتوان پیکره‌ای برای استعاره‌های فارسی تدوین کرد. برای انجام چنین کاری نیاز است که ملاک‌هایی برای شناسایی و برچسب‌گذاری استعاره معرفی شود. روال شناسایی استعاره‌ی دانشگاه آزاد آمستردام (ام.آی.پی.وی.یو) می‌تواند انواع استعاره را شناسایی کند و در ساخت پیکره استعاره نیز از آن می‌توان بهره برد. مبنای مقاله حاضر نیز همین روال شناسایی است. بهره‌گیری از این روال از دو جهت مفید است: نخست، به کمک این روال می‌توان پیکره‌ای از استعاره‌های فارسی تهیه کرد، دوم، به پژوهشگران حوزه استعاره، به ‌ویژه زبان‌شناسان پیکره‌ای، کمک می‌کند که با روایی و پایایی مطلوبی استعاره‌های فارسی را تحلیل کنند. لازم به گفتن است که برای آزمودن کارآیی روال پیشنهادی، پیکره‌ای از داده‌های فارسی (متون خبری و دانشگاهی) گردآوری و توسط سه کارشناس برچسب‌گذاری شده و یافته‌های مطلوبی (ضریب کاپای 0.964) به دست آمده‌است که در پژوهشی جداگانه به آن خواهیم پرداخت.
کلیدواژه	استعاره، زبان‌شناسی پیکره‌ای، پیکره استعاره‌ی فارسی، شناسایی استعاره، روال شناسایی استعاره (ام.آی.پی.وی.یو)
آدرس	دانشگاه علامه طباطبائی, گروه زبان‌شناسی همگانی, ایران
پست الکترونیکی	ms_miri@outlook.com

metaphor annotation criteria: a step towards building a metaphor corpus

Authors	miri mohammad saeid
Abstract	due to the development of smart devices, the ability of computers to understand human language has become a key issue in technology. by learning and analyzing machine-readable, annotated linguistic data, computers are able to comprehend human language (corpus). corpora plays a crucial role in helping computers comprehend human language. metaphor is one of the most complicated linguistic data that computers cannot comprehend. despite the prevalence of metaphor in everyday language use and the importance of identifying it, no corpus has been published for persian yet. compiling a corpus of persian metaphors is the initial step in learning metaphors for computers.to compile a corpus of persian metaphors, it is necessary to meet two main criteria. deciding the best definition is the first prerequisite. the best definition is both comprehensive and applicable; comprehensive in the sense that it covers a significant proportion of metaphorical instances, and applicable in the sense that it could be used to build a corpus. the second requirement is the construction of a method for metaphor identification. without a straightforward data annotation method, it is impossible to identify metaphors.