|
|
روشی جدید در بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود با استفاده از شبکه عصبی دوسویه
|
|
|
|
|
نویسنده
|
محمدنژاد حجت ,ولی منصور
|
منبع
|
پردازش علائم و داده ها - 1391 - دوره : 9 - شماره : 17 - صفحه:35 -48
|
چکیده
|
عملکرد سامانه های بازشناسی گفتار زمانی که گفتار توسط نوفه تخریب شده باشد، به شدّت کاهش می یابد. یکی از روش های رایج برای مقاوم سازی سامانه های بازشناسی گفتار استفاده از روش دادگان مفقود است. در این روش مولّفههایی از نمایش زمانی- فرکانسی گفتار (اسپکتروگرام) که نسبت سیگنال به نوفه (snr) آنها از یک آستانه کم تر است، به عنوان مولّفه های نامعتبر یا مفقود برچسب دهی می شوند. این مولّفه ها با استفاده از مولّفه های معتبر و اطّلاعات آماری نسبت به دادگان تمیز، تخمین زده شده و جایگزین می شوند.در این مقاله الگوی ویژگی های مفقود با دیدگاهی نو، به عنوان مسیله جبران سازی دادگان مطرح می شود. بدین صورت که با استفاده از شبکه عصبی دوسویه و انجام یک سری پردازشهای غیرخطی و دوطرفه (جلوسو و برگشتی) از دانش نهفته در مدل، ناشی از یادگیری هم-زمان گفتار تمیز و نوفهی بهره گرفته، بردارهای بازنمایی گفتار در جهت افزایش صحت بازشناسی آواها بهبود می یابند. در این روش نیازی به شناسایی مولّفههای مفقود که یک بحث چالش برانگیز در حوزه بازشناسی مقاوم گفتار مبتنی بر دادگان مفقود است، نمی باشد؛ بلکه بازسازی در جهت هرچه شبیه ترشدن تمامی مولّفهها، خواه معتبر باشد، خواه نامعتبر به مولّفههای گفتار تمیز صورت می گیرد و این یک برتری بسیار چشمگیری است که در این تحقیق حاصل شده است. نتایج مقایسه این دو روش نشان میدهد که با استفاده از روش دادگان مفقود، 2/4 درصد بهبود برای صحّت بازشناسی گفتار نوفهای با نسبت سیگنال به نوفه db0 حاصل شده درحالی که با استفاده از روش مبتنیبر شبکه عصبی دوسویه، 5/8 درصد بهبود برای همان نسبت سیگنال به نوفه به دست آمده است.
|
کلیدواژه
|
بازشناسی مقاوم گفتار ,دادگان مفقود ,شبکه عصبی دوسویه
|
آدرس
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|