|
|
تخمین میزان همبستگی بیست معیار ارزیابی کیفیت صدا با wer سیستم asr با روش gmdh و ترکیب ژنتیک با gpr
|
|
|
|
|
نویسنده
|
مهدیان راهیل ,صحت محمد مهدی
|
منبع
|
اجلاس فناوري رسانه - 1398 - دوره : 16 - اجلاس فناوری رسانه - کد همایش: 98190-87963 - صفحه:0 -0
|
چکیده
|
گفتار سادهترین و معمولترین ارتباط بین انسانها است. برای درک گفتار، آن گفتار باید قابلفهم باشد. اندازهگیری قابلیت فهم گفتار جز از طریق ارزیابهای ذهنی یا setup کردن سیستم asr ممکن نیست که هر دو روش بسیار هزینهبر و زمانبر است به همین دلیل اگر بتوان با روشی ریاضی معیاری پیدا کرد که همبستگی بالایی با مقدار خروجی ارزیابهای ذهنی یا مقدار wer سیستم asr داشته باشد. میتوان از آن روش برای تخمین قابلیت فهم گفتار استفاده کرد. در این تحقیق هدف این است که با استفاده از روشهای یادگیری ماشین میزان همبستگی 20 معیار ارزیابی کیفیت صدا با مقدار wer سیستم asr مشخص گردد؛ به همین دلیل با استفاده از پایگاه دادهی timit که سیستم asr برای آن setup شده است. پایگاه دادهای که نمونههای آن شامل 20 معیار ارزیابی کیفیت و یک مقدار wer است، تهیه گردید. این پایگاه داده شامل 10831 نمونه میباشد که نمونهها از ترکیب 4 نسبت سیگنال به نوفهی مختلف، 120 نوفه و 17 الگوریتم حذف نوفه و همچنین شامل 519 سیگنال واخنش دار بوده که این سیگنالها بازهی wer بین 22% تا 95% را شامل میشوند؛ برای افزایش داده و دقیقتر شدن نتایج 2 الگوریتم حذف واخنش روی این سیگنالهای واخنشدار اعمال شده است. هدف استفاده از این الگوریتمهای حذف نوفه و واخنش بررسی تاثیر اعوجاج ایجاد شده بوسیلهی آنها در نتایج خروجی روش پیشنهادی است. سپس با استفاده از شبکهی gmdh و روش پیشنهادی درصد همبستگی 20 معیار ارزیابی کیفیت با مقدار wer به دست آورده شد.
|
کلیدواژه
|
قابلیت فهم گفتار، شبکهی gmdh و gpr، سیستم asr، معیارهای ارزیابی کیفیت صدا.
|
آدرس
|
, iran, , iran
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|