|
|
بازشناسی مقاوم اعداد گفتار فارسی با شبکه عصبی عمیق
|
|
|
|
|
نویسنده
|
نصراصفهانی علی ,بکرانی مهدی ,رجبی روزبه
|
منبع
|
ششمين كنفرانس بينالمللي بازشناسي الگو و تحليل تصوير - 1401 - دوره : 6 - ششمین کنفرانس بینالمللی بازشناسی الگو و تحلیل تصویر - کد همایش: 01220-99203 - صفحه:0 -0
|
چکیده
|
از چالشهای مهم در بازشناسی اعداد در گفتار وجود نویز در صدای دریافتی دستگاههای دیجیتال و تشابهات وجهی اعداد میباشد. برای مقابله با این چالشها در این پژوهش، علاوه بر درنظرگرفتن واحد کلمه بهجای واحد واج، انجام عملیات دادهافزایی بهمنظور بهبود عملکرد سیستم، یک ساختار ترکیبی از دو شبکه عصبی کانولوشنال باقیمانده و شبکه عصبی واحد بازگشتی گیتی دوطرفه برای بازشناسی اعداد فارسی گسسته صفر تا نه از گفتار ارائه شده است. نتایج حاصل نشان میدهند که دقت بازشناسی گفتار روش پیشنهادی برای دادههای آموزش و اعتبارسنجی به ترتیب 98.53% و 96.10% است. این نتایج نسبت به روشهای مبتنی بر شبکه عصبی lstm دارای عملکرد بهتری است.
|
کلیدواژه
|
بازشناسی ارقام مجزا، دادهافزایی، شبکه عصبی کانولوشنال باقیمانده، شبکه عصبی واحد بازگشتی گیتی دوطرفه
|
آدرس
|
, iran, , iran, , iran
|
پست الکترونیکی
|
rajabi@qut.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|