|
|
ارائه یک روش نوین و کارآمد استخراج ویژگی برای بازشناسی گفتار مقاوم مبتنی بر تبدیل فوریه کسری و بهینه ساز تکامل تفاضلی
|
|
|
|
|
نویسنده
|
صادقی محسن ,مروی حسین ,احمدی فرد علیرضا
|
منبع
|
مدل سازي در مهندسي - 1399 - دوره : 18 - شماره : 61 - صفحه:85 -96
|
چکیده
|
یکی از چالش های اساسی در تشخیص گفتار، استخراج ویژگی مقاوم نسبت به نویز میباشد. در این مقاله یک الگوریتم استخراج ویژگی جدید که الگوریتم استخراج ضرائب کپسترال توان نرمالیزه شده کسری وفقی نامیده میشود، بعنوان یک روش مقاوم در برابر نویز برای کاربرد بازشناسی گفتار ارائه شده است. این روش استخراج ویژگی پیشنهادی مبتنی بر تبدیل فوریه گسسته کسری زمان کوتاه میباشد. از آنجایی که انتخاب ضریب تبدیل کسری برای تحلیل های مناسب سیگنال های چند جزئی از قبیل گفتار همچنان مورد بحث است، در این روش پیشنهادی با استفاده از الگوریتم فرا ابتکاری تکامل تفاضلی، پارامتر بهینه α برای تبدیل فوریه کسری با توجه به کلاس نویز موجود در محیط بصورت وفقی بدست میآید. همچنین از دادگان ti digit و noisex92 به منظور ارزیابی میزان مقاومت و دقت بازشناسی سیستم بازشناس گفتار خودکار استفاده شده است. نتایج شبیه سازی بیانگر مقاومت بیشتر و دقت بازشناسی بالاتر روش استخراج ویژگی پیشنهادی در قیاس با سایر روشهای استخراج ویژگی در محیطهای نویزی و بدون نویز می باشد. در سیستم asr پیشنهادی از طبقه بند ماشین بردار پشتیبان با کرنل غیرخطی استفاده شده است. لازم به ذکر است که تمامی شبیهسازیهای انجام شده توسط نرم افزار matlab صورت گرفته است.
|
کلیدواژه
|
تبدیل فوریه کسری، الگوریتم تکامل تفاضلی، استخراج ویژگی مقاوم، بازشناسی مقاوم گفتار، طبقه بند، asr، afpncc
|
آدرس
|
دانشگاه صنعتی شاهرود, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی برق و کامپیوتر, ایران
|
|
|
|
|
|
|
|
|
|
|
A New and Efficient Feature Extraction Method for Robust Speech Recognition Based on Fractional Fourier Transform and Differential Evolution Optimizer
|
|
|
Authors
|
Sadeghi Mohsen ,Marvi Hossein ,Ahmadyfard Ali Reza
|
Abstract
|
One of the main challenges in speech recognition is noise resistant feature extraction. In this paper, a new feature extraction algorithm, called Fractional and Adaptive Power Normalized Cepstral Coefficients Algorithm, has been proposed as a noiseresistant method for speech recognition. This proposed feature extraction method is based on a fractional shortterm Fourier Transform. The selection of fractional conversion coefficient is important for proper analysis of multicomponent signals like speech. Therefore, the proposed method obtains the optimum parameter of α for fractional Fourier Transform based on the noise class in the environment, adaptively by the Differential Evolution metaheuristic algorithm. Moreover, TI Digit and Noisex92 are used for evaluation of the resistance and accuracy of the recognition of the automatic speech recognition system. Simulation results show more resistance and higher recognition accuracy of the proposed feature extraction method rather than other methods in noisy and without noise environments. In the proposed ASR system, the Support Vector Machine (SVM) classifier with a nonlinear kernel has been used. Also, all the simulations are performed in MATLAB.
|
Keywords
|
ASR
|
|
|
|
|
|
|
|
|
|
|