>
Fa   |   Ar   |   En
   پایایی نمرات ترجمه‌های انسانی با بهره گیری از ابزارهای خودکار جانشین ارزیابی کیفیت ترجمه  
   
نویسنده کرمی سمیه ,نژادانصاری داریوش ,حسابی اکبر
منبع پژوهش هاي زبانشناختي در زبان هاي خارجي - 1399 - دوره : 10 - شماره : 3 - صفحه:618 -630
چکیده    با توجه به ماهیت فرایند ارزیابی ترجمه که از لحاظ زمان، انرژی و هزینه قابل تامل می‌باشد، بهره‌گیری از فن‌آوری‌های نوین در حوزه‌ ترجمه ماشینی منطقی به نظر می‌رسد. ابزارهای خودکار جانشین ارزیابی کیفیت ترجمه یکی از این فن‌آوری‌ها است که در حوزه ترجمه ماشینی کاربرد دارد. این پژوهش در صدد یافتن پاسخ این سوال است که پایایی نمرات این ابزارها در سطح واژگان به ترجمه‌های انسانی (51 دانشجوی سال آخر رشته ترجمه در ایران) با استفاده از 1، 2، ... تا 5 ترجمه معیار به صورت مرحله به مرحله و جداگانه چه تغییری می‌کند. لذا پژوهشی تجربی و کاربردی با رویکردی کمی برای محاسبه میزان پایایی نمرات این ابزارها در مقایسه با میانگین نمرات 5 ارزیاب‌ متخصص انجام شد. میزان رابطه همبستگی میان این دو مجموعه نمره (در حالت‌های مختلف استفاده از 1، 2، ... تا 5 ترجمه معیار) به منزله پایایی نمرات ابزار خودکار تفسیر شده است. نتایج تحلیل آزمون همبستگی پیرسون نشان داد که استفاده از 5 ترجمه معیار در 37/80درصد موارد منجر به بالاترین میزان رابطه همبستگی شده است که بیشتر از هر حالت دیگر در این پژوهش است (4 ترجمه معیار (3/65درصد)، 3 ترجمه معیار (10,97 درصد)، 2 ترجمه معیار (31/70 درصد) و1 ترجمه معیار (15/85 درصد)). بنابراین، فرضیه پژوهش تایید می‌شود که استفاده از ترجمه‌های معیار بیشتر منجر به رابطه همبستگی بالاتر و پایایی بیشتر نمرات می‌شود. در عین حال، استفاده از 2 ترجمه معیار جایگاه دوم را از نظر دستیابی به بالاترین میزان رابطه همبستگی دارد و فرضیه پژوهش را نقض می‌کند.
کلیدواژه ارزیابی کیفیت ترجمه، ابزارهای خودکار جانشین ارزیابی کیفیت ترجمه، نمره‌دهی خودکار، پایایی، ترجمه معیار
آدرس دانشگاه اصفهان, ایران, دانشگاه اصفهان, گروه زبان و ادبیات انگلیسی, ایران, دانشگاه اصفهان, گروه زبان و ادبیات انگلیسی, ایران
پست الکترونیکی a.hesabi@fgn.ui.ac.ir
 
   Reliability of Human Translations’ Scores Using Automated Translation Quality Evaluation Understudy Metrics  
   
Authors Hesabi Akbar ,Nejadansari Dariush ,Karami Somayyeh
Abstract    Considering the costly nature of translation quality assessment in terms of time, money and energy, it seems logical to benefit from the modern technologies that are introduced in the field of machine translation (MT). Automated Translation Quality Evaluation Understudy Metrics (ATQEUMs) are one of these technologies that have revealed a promising application in assessing the MT output quality. This study, however, attempts to examine the reliability of the scores provided by the lexical ATQEUMs to human translated texts (i.e. the ones provided by 51 senior students of translator training programs in Iran) using 1, 2, …, 5 reference translations successively and separately. To this end, an empirical applied study is conducted following a quantitative approach to assess the reliability of the lexical ATQEUMs’ scores in comparison to the expert scorers’ scores. The higher the correlation between the sets of scores (in different stages of using 1, 2, …, 5 reference translations), the higher the reliability is interpreted to be. The results of the Pearson correlation coefficient analysis revealed that using 5 reference translations had led to the highest correlations in 37.80% of cases, which is more than the number for any other situation considered (i.e. using 4 reference translations (3.65%), 3 reference translations (10.97%), 2 reference translations (31.70%), and 1 reference translation (15.85%)). However, using 2 reference translations achieved the second position in having the highest correlations which contradicted the hypothesis that more reference translations would lead to higher correlations and reliability.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved