|
|
کاهش اثر نوفه باد در گفتار ضبط شده با بهرهگیری از مجموعه دادههای تحلیل طیفی تکین (تطت- اِساِساِی) و شیوه یادگیری ماشین (مقاله پژوهشی)
|
|
|
|
|
نویسنده
|
شفیعیان معصومه ,قیاسوند فرشاد
|
منبع
|
مجله انجمن مهندسي صوتيات ايران - 1400 - دوره : 9 - شماره : 2 - صفحه:111 -119
|
چکیده
|
در حالت کلی ضبط صدا در محیطهای مختلف با چالشهای متفاوتی روبهرو میباشد. نوفه باد در فضای باز اغلب باعث افت شدید کیفیت علامت گفتار میشود. بنابراین باید الگوریتمهایی برای کاهش نوفه باد بهکار برد. به دلیل ماهیت ناایستا و پهنباند بودن نوفه باد، صافی کردن (فیلتر کردن) و حذف کردن آن بسیار مشکل است. تحلیل طیفی تکین (اِساِساِی) یک روش قدرتمند تخمین طیفی است که از آن در کاربردهایی از جمله کاهش نوفه، پیشبینی سری زمانی و غیره استفاده میشود. الگوریتم اِساِساِی علامتها را به فضاهای مقدار ویژه تجزیه میکند، مولفههای اصلی را براساس سهم آنها انتخاب و دستهبندی میکند و سرانجام مولفههای مطلوب را ساخته و به حوزه زمان برمیگرداند. در این پژوهش از روش اِساِساِی و الگوریتم کِی مینز و صافی بول به شکل ترکیبی و بهمنظور کاهش نوفه باد در علامتهای گفتار استفاده شده است. علامت گفتار مورد استفاده در روند پژوهش از دادگان تیآیاِمآیتی استخراجشده است و نوفه باد استفادهشده نیز مربوط به دادگانی است که توسّط دانشگاه فنی آخن ارائه گردیدهاند. نتایج نشان میدهند که روش پیشنهادی قادر است تا مقدار 51 درصد میزان کیفیت علامت گفتار را از لحاظ کیفیت ادراکی بهبود بخشد. روش ارائهشده در مقایسه با روشهای مرسوم از قبیل وزندهی طیفی و تفریق طیفی نتایج بهتری از خود نشان میدهند.
|
کلیدواژه
|
تحلیل طیفی تکین (اِساِساِی)، کاهش نوفه باد، الگوریتم کِی- مینز، کیفیت ادراکی، علامت گفتار.
|
آدرس
|
دانشگاه صدا و سیما, دانشکده فنی و مهندسی رسانه, ایران, دانشگاه صدا و سیما, دانشکده فنی و مهندسی رسانه, ایران
|
پست الکترونیکی
|
farshadghiasvand7@gmail.com
|
|
|
|
|
|
|
|
|
Wind noise reduction in recorded speech using Singular Spectrum Analysis (SSA) dataset and machine learning method (Research Article)
|
|
|
Authors
|
Shafieian M. ,Ghiasvand F.
|
Abstract
|
In general, recording audio in different environments deals with different challenges. Wind noise in outdoors recording often leads to critical degradation to the speech signal. Because of wide band and nonstationary nature of wind noise, it is very difficult to remove it. Singular Spectrum Analysis (SSA) is a powerful method for time series analysis that is used in applications such as noise reduction, time series prediction and so on. The SSA selects and groups the principal components of the Eigenspace decomposed signals, based on their contributions; then the reconstructed main components are transferred to time domain. In our research, the SSA method combined with KMEANS algorithm are used to reduce wind noise in speech signals. SNR and PESQ, are used to evaluate the proposed method rsquo;s results. Speech signals from TIMIT dataset and wind noise from RheinischWestf auml;lische Technische Hochschule Aachen have been utilized in this research. The results show great increase in the quality of speech signal, in terms of perceptual quality and signal to noise ratio. The proposed algorithm shows the good performance compared with other reference algorithms.
|
Keywords
|
Singular Spectrum Analysis ,Wind noise reduction ,K-MEANS algorithm ,Perceptual quality ,Speech signal.
|
|
|
|
|
|
|
|
|
|
|