|
|
تولید متن با رویکرد جمعی مبتنی بر شبکههای مولد مقابلهای
|
|
|
|
|
نویسنده
|
منتهایی احسان ,سلیمانی باغشاه مهدیه
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1399 - دوره : 18 - شماره : 2 - صفحه:117 -126
|
چکیده
|
تولید متن یکی از مسایل مهم در حوزه پردازش زبان طبیعی به حساب میآید. روشهای پایه ارائهشده در این حوزه، دارای مشکلاتی نظیر ناهمخوانی داده در زمان آموزش و آزمون و همچنین تابع هدف نامناسب هستند. در چند سال اخیر پیشرفتهای زیادی در حوزه تولید تصویر به وسیله شبکههای مولد مقابلهای انجام شده است. همین موضوع باعث شده که استفاده از شبکههای مولد مقابلهای در تولید متن نیز به تازگی مورد توجه قرار گیرد. اما به دلیل گسستهبودن جنس دنبالهها، این امر به سادگی میسر نبوده و برای حل آن نیاز به استفاده از راهکارهایی مثل یادگیری تقویتی و استفاده از تقریب وجود دارد. به علاوه ناپایداری شبکههای مولد مقابلهای باعث ایجاد چالشهای جدید و بالارفتن پیچیدگی مساله میشود.در این پژوهش با رویکردی جدید که جمعی و مبتنی بر ایده شبکههای مولد مقابلهای است به ارائه روشی جمعی برای حل مساله تولید متن میپردازیم. اساس روش پیشنهادی تخمین نسبت چگالی احتمال بوده و با این رویکرد روشی بدون مشکل در برابر گسستگی دنبالهها ارائه شده است. راهکار ارائهشده نسبت به روشهای شبکههای مولد مقابلهای در حوزه دنباله، آموزشی پایدارتر دارد و همچنین مشکل اُریبی مواجهه نیز در روش پیشنهادی وجود ندارد.آزمایشهای انجامشده نشاندهنده برتری روش پیشنهادی در مقایسه با روشهای پیشین بر روی مجموعه دادههای معروف مربوط به تولید متن است.
|
کلیدواژه
|
تولید متن، مدل مولد، شبکههای gan، یادگیری جمعی
|
آدرس
|
دانشگاه صنعتی شریف, دانشکده مهندسی کامپیوتر, ایران, دانشگاه صنعتی شریف, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
soleymani@sharif.edu
|
|
|
|
|
|
|
|
|
Text Generation by a GANbased Ensemble Approach
|
|
|
Authors
|
Montahaie Ehsan ,Soleymani Baghshah Mahdieh
|
Abstract
|
Text generation is one of the important problems in Natural Language Processing field. The former methods for text generation that are based on language modeling by the teacher forcing approach encounter the problem of discrepancy between the training and test phases and also employing an inappropriate objective (i.e., Maximum Likelihood estimation) for generation. In the past years, Generative Adversarial Networks (GANs) have achieved much popularity due to their capabilities in image generation. These networks have also attracted attention for sequence generation in the last few years. However, since text sequences are discrete, GANs cannot be easily employed for text generation, and new approaches like Reinforcement Learning and approximation have been utilized for this purpose. Furthermore, the instability problem of GANs training causes new challenges. In this paper, a new GANbased ensemble method is proposed for sequence generation problem. The idea of the proposed method is based on the ratio estimation which enables the model to overcome the problem of discreteness in data. Also, the proposed method is more stable than the other GANbased methods. It also should be noted that the exposure bias problem of teacher forcing approach does not exist in the proposed method. Experiments show the superiority of the proposed method to previous GANbased methods for text generation.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|