کاهش اثر نوفه باد در گفتار ضبط‌ شده با بهره‌گیری از مجموعه داده‌های تحلیل طیفی تکین (تطت- اِس‌اِس‌اِی) و شیوه یادگیری ماشین (مقاله پژوهشی)

Fa | Ar | En

کاهش اثر نوفه باد در گفتار ضبط‌ شده با بهره‌گیری از مجموعه داده‌های تحلیل طیفی تکین (تطت- اِس‌اِس‌اِی) و شیوه یادگیری ماشین (مقاله پژوهشی)


نویسنده	شفیعیان معصومه ,قیاسوند فرشاد
منبع	مجله انجمن مهندسي صوتيات ايران - 1400 - دوره : 9 - شماره : 2 - صفحه:111 -119
چکیده	در حالت کلی ضبط صدا در محیط‌های مختلف با چالش‌های متفاوتی روبه‌رو می‌باشد. نوفه باد در فضای باز اغلب باعث افت شدید کیفیت علامت گفتار می‌شود. بنابراین باید الگوریتم‌هایی برای کاهش نوفه باد به‌کار برد. به دلیل ماهیت ناایستا و پهن‌باند بودن نوفه باد، صافی کردن (فیلتر کردن) و حذف کردن آن بسیار مشکل است. تحلیل طیفی تکین (اِس‌اِس‌اِی) یک روش قدرتمند تخمین طیفی است که از آن در کاربردهایی از جمله کاهش نوفه، پیش‌بینی سری زمانی و غیره استفاده می‌شود. الگوریتم اِس‌اِس‌اِی علامت‌ها را به فضاهای مقدار ویژه تجزیه می‌کند، مولفه‌های اصلی را براساس سهم آن‌ها انتخاب و دسته‌بندی می‌کند و سرانجام مولفه‌های مطلوب را ساخته و به حوزه زمان برمی‌گرداند. در این پژوهش از روش اِس‌اِس‌اِی و الگوریتم کِی مینز و صافی بول به شکل ترکیبی و به‌منظور کاهش نوفه باد در علامت‌های گفتار استفاده ‌شده است. علامت گفتار مورد استفاده‌ در روند پژوهش از دادگان تی‌آی‌اِم‌آی‌تی استخراج‌شده است و نوفه باد استفاده‌شده نیز مربوط به دادگانی است که توسّط دانشگاه فنی آخن ارائه گردیده‌اند. نتایج نشان می‌دهند که روش پیشنهادی قادر است تا مقدار 51 درصد میزان کیفیت علامت گفتار را از لحاظ کیفیت ادراکی بهبود بخشد. روش ارائه‌شده در مقایسه با روش‌های مرسوم از قبیل وزن‌دهی طیفی و تفریق طیفی نتایج بهتری از خود نشان می‌دهند.
کلیدواژه	تحلیل طیفی تکین (اِس‌اِس‌اِی)، کاهش نوفه باد، الگوریتم کِی- مینز، کیفیت ادراکی، علامت گفتار.
آدرس	دانشگاه صدا و سیما, دانشکده فنی و مهندسی رسانه, ایران, دانشگاه صدا و سیما, دانشکده فنی و مهندسی رسانه, ایران
پست الکترونیکی	farshadghiasvand7@gmail.com

Wind noise reduction in recorded speech using Singular Spectrum Analysis (SSA) dataset and machine learning method (Research Article)

Authors	Shafieian M. ,Ghiasvand F.
Abstract	In general, recording audio in different environments deals with different challenges. Wind noise in outdoors recording often leads to critical degradation to the speech signal. Because of wide band and nonstationary nature of wind noise, it is very difficult to remove it. Singular Spectrum Analysis (SSA) is a powerful method for time series analysis that is used in applications such as noise reduction, time series prediction and so on. The SSA selects and groups the principal components of the Eigenspace decomposed signals, based on their contributions; then the reconstructed main components are transferred to time domain. In our research, the SSA method combined with KMEANS algorithm are used to reduce wind noise in speech signals. SNR and PESQ, are used to evaluate the proposed method rsquo;s results. Speech signals from TIMIT dataset and wind noise from RheinischWestf auml;lische Technische Hochschule Aachen have been utilized in this research. The results show great increase in the quality of speech signal, in terms of perceptual quality and signal to noise ratio. The proposed algorithm shows the good performance compared with other reference algorithms.
Keywords	Singular Spectrum Analysis ,Wind noise reduction ,K-MEANS algorithm ,Perceptual quality ,Speech signal.