>
Fa   |   Ar   |   En
   بازشناسی مقاوم اعداد گفتار فارسی با شبکه عصبی عمیق  
   
نویسنده نصراصفهانی علی ,بکرانی مهدی ,رجبی روزبه
منبع ششمين كنفرانس بين‌المللي بازشناسي الگو و تحليل تصوير - 1401 - دوره : 6 - ششمین کنفرانس بین‌المللی بازشناسی الگو و تحلیل تصویر - کد همایش: 01220-99203 - صفحه:0 -0
چکیده    از چالش‌های مهم در بازشناسی اعداد در گفتار وجود نویز در صدای دریافتی دستگاه‌های دیجیتال و تشابهات وجهی اعداد می‌باشد. برای مقابله با این چالش‌ها در این پژوهش، علاوه بر درنظرگرفتن واحد کلمه به‌جای واحد واج، انجام عملیات داده‌افزایی به‌منظور بهبود عملکرد سیستم، یک ساختار ترکیبی از دو شبکه عصبی کانولوشنال باقیمانده و شبکه عصبی واحد بازگشتی گیتی دوطرفه برای بازشناسی اعداد فارسی گسسته صفر تا نه از گفتار ارائه شده است. نتایج حاصل نشان می‌دهند که دقت بازشناسی گفتار روش پیشنهادی برای داده‌های آموزش و اعتبارسنجی به ترتیب 98.53% و 96.10% است. این نتایج نسبت به روش‌های مبتنی بر شبکه عصبی lstm دارای عملکرد بهتری است.
کلیدواژه بازشناسی ارقام مجزا، داده‌افزایی، شبکه عصبی کانولوشنال باقیمانده، شبکه عصبی واحد بازگشتی گیتی دوطرفه
آدرس , iran, , iran, , iran
پست الکترونیکی rajabi@qut.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved