|
|
طبقهبندی ویژگی های گفتار مقاوم به نوفه در سامانه تعیین هویت گوینده
|
|
|
|
|
نویسنده
|
میربیگی محدثه ,مه آبادی امین اله ,رنجبر اکبر
|
منبع
|
مجله انجمن مهندسي صوتيات ايران - 1400 - دوره : 9 - شماره : 1 - صفحه:28 -39
|
چکیده
|
تشخیص خودکار هویت گوینده کاربردهای وسیعی در سامانه های صنعتی و امنیتی دارد و وابسته به ویژگی علامت گفتار است. کاربرد ماتریس ویژگی در شناسایی بی درنگ گوینده بسیار مهم و وجود نوفه محیطی و پردازشی منجر به تغییر مشخصات ویژگی ها و تولید خطا در تعیین هویت است. افزایش دقت در تشخیص هویت به فرایند حذف نوفه برای تعیین صحیح ویژگیهای انرژی، آنتروپی انرژی، نرخ عبور از صفر، مرکز ثقل طیفی، گسترش طیفی، آنتروپی طیفی، شار طیفی، و رل آف طیفی از علامت گوینده نیاز دارد. در طراحی الگوریتمهای بی درنگ و قابل اعتماد، فرایندهای مهم استخراج صحیح گفتار، شناسایی میزان حساسیت و سنجش میزان مقاومت مولفههای علامت برای حذف نوفه و بهبود کیفیت گفتار در بهبود علامت به نوفه نقش اساسی دارند. هدف اصلی این مقاله ارایه روش طبقهبندی ویژگی های علامت گفتار جهت طراحی الگوریتم های بی درنگ تعیین هویت گوینده و مقاوم به نوفه با سنجش میزان مقاومت آن است. روش پیشنهادی حذف نوفه از ماسک دودویی با ویژگی مقاوم مشخص بهره می برد و نتایج تجربی آزمایشها روی داده ها، بهبود علامت به نوفه 2 الی 3 دسی بل را نشان میدهد. ارزیابی ماتریس ویژگی در سامانه تشخیص هویت از ضریب کپسترال بسامد مل و ضریب پیشگویی خطی و ضریب کپستروم تشکیل شده که با روش فاصله یابی اقلیدسی در مجموعه داده های استاندارد ارزیابی شده است. روش پیشنهادی با وجود داده های نوفه ای توانسته قدرت تشخیص تعیین هویت گوینده را به دقت بالای 80 درصد و سرعت بی درنگ افزایش دهد.
|
کلیدواژه
|
طبقهبندی ویژگی های گفتار، تعیین هویت گوینده، مقاوم به نوفه، علامت گفتار، نوفه.
|
آدرس
|
دانشگاه شاهد, دانشکده فنی مهندسی، مرکز تحقیقات آکوستیک, گروه مهندسی کامپیوتر, ایران, دانشگاه شاهد, دانشکده فنی مهندسی، مرکز تحقیقات آکوستیک, گروه مهندسی کامپیوتر, ایران, دانشگاه شاهد, دانشکده فنی مهندسی، مرکز تحقیقات آکوستیک, گروه مهندسی الکترونیک, ایران
|
پست الکترونیکی
|
ranjbar@shahed.ac.ir
|
|
|
|
|
|
|
|
|
Classification of noise-robust speech features in the speaker authentication system (Research Article)
|
|
|
Authors
|
Mirbeygi M. ,Mahabadi A. ,Ranjbar A.
|
Abstract
|
Automatic speaker recognition has a wide range of applications in industrial and security systems and requires the extraction of speech signal features. The use of the feature matrix is very important in realtime recognition of the speaker, and the presence of environmental and processing noise leads to a violation in the characteristics of the features and the production of recognition errors. Increasing the accuracy of recognition detection requires the noise removal process to correctly determine the energy characteristics, energy entropy, zero crossing rate, spectral centroid, spectral spread, spectral entropy, spectral flux, and spectral roll off the signal. In designing realtime and reliable algorithms, there are critical processes of correct speech extraction, sensitivity detection, and measuring the robustness of signal parameters to eliminate noise and improve speech quality, which play a key role in improving the signaltonoise ratio. In this paper, the classification of speech signal features for designing realtime and noiserobust speaker recognition algorithms in measuring its robustness are investigated. The proposed method of noise removal uses a binary mask with a robust feature and the experimental results of the experiments on the standard data show the rate of signal improvement to the noise of approximately 2 to 3 db. The feature matrix evaluation for the authentication system consists of mel frequency coefficient, linear prediction coefficient and, cepstrum coefficient, which has been evaluated by the Euclidean distance method in another experimental standard data set. Our proposed method achieves on overall 80% realtime recognition accuracy in noisy data set.
|
Keywords
|
Classification of speech features ,Speaker authentication ,Noise-robust ,Speech signal ,Noise.
|
|
|
|
|
|
|
|
|
|
|