>
Fa   |   Ar   |   En
   ارائه یک سامانه ترجمه ماشینی ترکیبی بر پایه رمزگشای یک‌نوا  
   
نویسنده خاتمی حسین ,فدایی حکیمه ,فیلی هشام
منبع پردازش علائم و داده ها - 1398 - شماره : 2 - صفحه:77 -90
چکیده    در این مقاله یک مترجم خودکار متون انگلیسی به فارسی با استفاده از معماری ترکیبی قاعده مند و آماری ارائه شده است. این معماری ترکیبی به منظور بهبود نتایج هر دو مترجم، خروجی مترجم ماشینی قاعده مند و آماری را ترکیب کرده و سعی می کند یک خروجی برتر از هر دو سامانه ایجاد کند. در این راستا از یک رمزگشای یک نوا با پیچیدگی زمانی چند جمله ای استفاده می شود. مترجم های ماشینی قاعده مند عمل ترجمه را بر اساس مجموعه ای از قواعد زبانی انجام می دهند. به طور معمول نتایج آنها از نظر ترتیب کلمات و ساختار نحوی، کیفیت بهتری نسبت به نتایج مترجم های آماری دارند؛ ولی عملکرد این مترجم ها در زمینه انتخاب لغات مناسب و روانی ترجمه، ضعیف تر از مترجم های ماشینی آماری است. از این رو در این معماری، ترجمه اولیه به وسیله مترجم ماشینی قاعده مند صورت می گیرد؛ سپس با استفاده از مترجم ماشینی آماری ترجمه آن بهبود داده می شود. به این منظور، ترتیب واژگان در ترجمه نهایی بر اساس ترجمه مترجم ماشینی قاعده مند صورت می گیرد؛ سپس عمل ترجمه و انتخاب لغات توسط رمزگشای یک نوا، با درنظر گرفتن ترجمه های نامزدهای ارائه شده توسط مترجم قاعده مند و آماری و همچنین با استفاده از مدل زبانی، انجام می شود. آزمایش های انجام شده نشان می دهند که کیفیت نتایج به دست آمده از معماری ترکیبی در معیار بلو، به طورتقریبی پنج واحد بهتر از نتایج مترجم ماشینی قاعده مند است. همچنین کیفیت این نتایج نسبت به نتایج مترجم ماشینی آماری در معیار بلو، یک واحد بهتر است.
کلیدواژه مترجم ماشین، معماری ترکیبی، رمزگشای یکنوا، ترتیب کلمات ترجمه، انتخاب لغات
آدرس دانشگاه تهران، پردیس دانشکده های فنی, دانشکدۀ مهندسی برق و کامپیوتر, ایران, دانشگاه تهران، پردیس دانشکده های فنی, دانشکدۀ مهندسی برق و کامپیوتر, ایران, دانشگاه تهران، پردیس دانشکده های فنی, دانشکدۀ مهندسی برق و کامپیوتر, ایران
 
   A Hybrid Machine Translation System Based on a Monotone Decoder  
   
Authors fadaei hakime ,faili hesham ,khatami hosein
Abstract    In this paper, a hybrid Machine Translation (MT) system is proposed by combining the result of a rulebased machine translation (RBMT) system with a statistical approach. The RBMT uses a set of linguistic rules for translation, which leads to better translation results in terms of word ordering and syntactic structure. On the other hand, SMT works better in lexical choice. Therefore, in our system, an initial translation is generated using RBMT. Then the proper lexical for the resulted sentence is chosen by using a decoder algorithm which is inspired by SMT architecture. In the pure SMT approach, decoder is responsible for selecting proper final lexical during the translation procedure. Normally this method deals with lexical choice as well as reordering and required exponential order in time complexity. By fixing the word order in the output, a polynomial version of this method, named monotone decoding, is used in this paper. Monotone decoder algorithm selects the best lexical from a candidate list by maximizing the language model of resulted sentence. The candidate list is gathered from the outputs of both pure RBMT and pure SMT systems. The experiments of proposed hybrid method on EnglishPersian language pair show significant improvements over both RBMT and SMT results. The results show that the proposed hybrid method gains an improvement of almost +5 units over RBMT and about one unit over SMT in BLEU score.
Keywords Machine translation ,hybrid architecture ,monotone decoder ,translation reordering ,lexical choice
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved