|
|
تشخیص واکههای فارسی از روی اسپکتروگرام سیگنال گفتار با استفاده از شبکه عصبی کانولوشن
|
|
|
|
|
نویسنده
|
اکبری نرگس ,عسگری محمد ,مهدیان ترقی راهیل
|
منبع
|
اجلاس فناوري رسانه - 1398 - دوره : 16 - اجلاس فناوری رسانه - کد همایش: 98190-87963 - صفحه:0 -0
|
چکیده
|
یکی از رویکردهای بازشناسیِ گفتارِ مبتنی بر تشخیص الگو، مدل کردن گفتار برمبنای تعدادی واحد آوایی است. محتوای گفتار براساس واکه مشخص میشود. همچنین به دلیل اینکه مشخصات فرکانسی و زمانی واکهها پایدارتر از سایر واجها هستند، تشخیص واکهها برای تشخیص گفتار مهم هستند. در این تحقیق دقتِ تشخیص واکههای فارسی از روی دادگان دو واجی فارسی (ترکیب یک همخوان و یک واکه) به صورت مستقل از گوینده با استفاده از شبکه عصبی کانولوشن بهبود داده شده است. دادگان ساخته شده برای این تحقیق شامل 30 گوینده است که 23 همخوان فارسی را برای 6 واکه فارسی می خوانند. اسپکتروگرام هر داده صوتی رسم و پس از پردازش به عنوان ورودی به شبکه عصبی کانولوشن داده میشوند. برای مدل پیشنهادی میانگین دقتِ تشخیص واکه 89 % بدست آمده است. همچنین مدل ارائه شده به منظور تشخیص واکههای فارسی از روی سیگنال گفتار پیوسته فارسی، تشخیص آواهای گفتاری از آواهای غیرگفتاری، تشخیص واکههای فارسی دارای نوفه از روی دادگان آموزشی تمیز و تشخیص آنلاین واکه نیز تست شده است که به ترتیب میانگین دقتهای 79 % ، 7/88 % و 5/75 % (برای نوفه خیابان با نسبت سیگنال به نوفه 10 دسیبل) حاصل شده است.
|
کلیدواژه
|
تشخیص واکههای فارسی، شبکه عصبی کانولوشن، کلاسبندی، دادگان، نوفه.
|
آدرس
|
, iran, , iran, , iran
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|