>
Fa   |   Ar   |   En
   تخمین میزان همبستگی بیست معیار ارزیابی کیفیت صدا با wer سیستم asr با روش gmdh و ترکیب ژنتیک با gpr  
   
نویسنده مهدیان راهیل ,صحت محمد مهدی
منبع اجلاس فناوري رسانه - 1398 - دوره : 16 - اجلاس فناوری رسانه - کد همایش: 98190-87963 - صفحه:0 -0
چکیده    گفتار ساده‌ترین و معمول‌ترین ارتباط بین انسان‌ها است. برای درک گفتار، آن گفتار باید قابل‌فهم باشد. اندازه‌گیری قابلیت فهم گفتار جز از طریق ارزیاب‌های ذهنی یا setup کردن سیستم asr ممکن نیست که هر دو روش بسیار هزینه‌بر و زمان‌بر است به همین دلیل اگر بتوان با روشی ریاضی معیاری پیدا کرد که همبستگی بالایی با مقدار خروجی ارزیاب‌های ذهنی یا مقدار wer سیستم asr داشته باشد. می‌توان از آن روش برای تخمین قابلیت فهم گفتار استفاده کرد. در این تحقیق هدف این است که با استفاده از روش‌های یادگیری ماشین میزان همبستگی 20 معیار ارزیابی کیفیت صدا با مقدار wer سیستم asr مشخص گردد؛ به همین دلیل با استفاده از پایگاه‌ داده‌ی timit که سیستم asr برای آن setup شده است. پایگاه داده‌ای که نمونه‌های آن شامل 20 معیار ارزیابی کیفیت و یک مقدار wer است، تهیه گردید. این پایگاه داده شامل 10831 نمونه می‌باشد که نمونه‌ها از ترکیب 4 نسبت سیگنال به نوفه‌ی مختلف، 120 نوفه و 17 الگوریتم حذف نوفه و همچنین شامل 519 سیگنال واخنش دار بوده که این سیگنال‌ها بازه‌ی wer بین 22% تا 95% را شامل می‌شوند؛ برای افزایش داده و دقیق‌تر شدن نتایج 2 الگوریتم حذف واخنش روی این سیگنال‌های واخنش‌دار اعمال شده است. هدف استفاده از این الگوریتم‌های حذف نوفه و واخنش بررسی تاثیر اعوجاج ایجاد شده بوسیله‌ی آن‌ها در نتایج خروجی روش پیشنهادی است. سپس با استفاده از شبکه‌ی gmdh و روش پیشنهادی درصد همبستگی 20 معیار ارزیابی کیفیت با مقدار wer به دست آورده شد.
کلیدواژه قابلیت فهم گفتار، شبکه‌ی gmdh و gpr، سیستم asr، معیارهای ارزیابی کیفیت صدا.
آدرس , iran, , iran
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved