>
Fa   |   Ar   |   En
   روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه  
   
نویسنده محمدنژاد حجت ,ولی منصور
منبع پردازش علائم و داده ها - 1391 - دوره : 9 - شماره : 17 - صفحه:35 -48
چکیده    عملکرد سامانه های بازشناسی گفتار زمانی که گفتار توسط نوفه تخریب شده باشد، به شدّت کاهش می یابد. یکی از روش های رایج برای مقاوم سازی سامانه های بازشناسی گفتار استفاده از روش دادگان مفقود است. در این روش مولّفه‌هایی از نمایش زمانی- فرکانسی گفتار (اسپکتروگرام) که نسبت سیگنال به نوفه (snr) آنها از یک آستانه کم تر است، به عنوان مولّفه های نامعتبر یا مفقود برچسب دهی می شوند. این مولّفه ها با استفاده از مولّفه های معتبر و اطّلاعات آماری نسبت به دادگان تمیز، تخمین زده شده و جایگزین می شوند.در این مقاله الگوی ویژگی های مفقود با دیدگاهی نو، به عنوان مسیله جبران سازی دادگان مطرح می شود. بدین صورت که با استفاده از شبکه عصبی دوسویه و انجام یک سری پردازش‌های غیرخطی و دوطرفه (جلوسو و برگشتی) از دانش نهفته در مدل، ناشی از یادگیری هم-زمان گفتار تمیز و نوفهی بهره گرفته، بردارهای بازنمایی گفتار در جهت افزایش صحت بازشناسی آواها بهبود می یابند. در این روش نیازی به شناسایی مولّفه‌های مفقود که یک بحث چالش برانگیز در حوزه بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود است، نمی باشد؛ بلکه بازسازی در جهت هرچه شبیه ترشدن تمامی مولّفه‌ها، خواه معتبر باشد، خواه نامعتبر به مولّفه‌های گفتار تمیز صورت می گیرد و این یک برتری بسیار چشم‌گیری است که در این تحقیق حاصل شده است. نتایج مقایسه این دو روش نشان می‌دهد که با استفاده از روش دادگان مفقود، 2/4 درصد بهبود برای صحّت بازشناسی گفتار نوفه‌ای با نسبت سیگنال به نوفه db0 حاصل شده درحالی که با استفاده از روش مبتنی‌بر شبکه عصبی دوسویه، 5/8 درصد بهبود برای همان نسبت سیگنال به نوفه به دست آمده است.
کلیدواژه بازشناسی مقاوم گفتار ,دادگان مفقود ,شبکه عصبی دوسویه
آدرس
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved