>
Fa   |   Ar   |   En
   تشخیص واکه‌های فارسی از روی اسپکتروگرام سیگنال گفتار با استفاده از شبکه عصبی کانولوشن  
   
نویسنده اکبری نرگس ,عسگری محمد ,مهدیان ترقی راهیل
منبع اجلاس فناوري رسانه - 1398 - دوره : 16 - اجلاس فناوری رسانه - کد همایش: 98190-87963 - صفحه:0 -0
چکیده    یکی از رویکردهای بازشناسیِ گفتارِ مبتنی بر تشخیص الگو، مدل کردن گفتار برمبنای تعدادی واحد آوایی است. محتوای گفتار براساس واکه مشخص می‌شود. همچنین به دلیل این‌که مشخصات فرکانسی و زمانی واکه‌ها پایدارتر از سایر واج‌ها هستند، تشخیص واکه‌ها برای تشخیص گفتار مهم هستند. در این تحقیق دقتِ تشخیص واکه‌های فارسی از روی دادگان دو واجی فارسی‌ (ترکیب یک همخوان و یک واکه) به صورت مستقل از گوینده با استفاده از شبکه عصبی کانولوشن بهبود داده شده است. دادگان ساخته شده برای این تحقیق شامل 30 گوینده است که 23 همخوان فارسی را برای 6 واکه فارسی می خوانند. اسپکتروگرام هر داده صوتی رسم و پس از پردازش به عنوان ورودی به شبکه عصبی کانولوشن داده می‌شوند. برای مدل پیشنهادی میانگین دقتِ تشخیص واکه 89 % بدست آمده است. همچنین مدل ارائه شده به منظور تشخیص واکه‌های فارسی از روی سیگنال گفتار پیوسته فارسی، تشخیص آواهای گفتاری از آواهای غیرگفتاری، تشخیص واکه‌های فارسی دارای نوفه از روی دادگان آموزشی تمیز و تشخیص آنلاین واکه نیز تست شده است که به ترتیب میانگین دقت‌های 79 % ، 7/88 % و 5/75 % (برای نوفه خیابان با نسبت سیگنال به نوفه 10 دسی‌بل) حاصل شده است.
کلیدواژه تشخیص واکه‌های فارسی، شبکه عصبی کانولوشن، کلاس‌بندی، دادگان، نوفه.
آدرس , iran, , iran, , iran
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved