>
Fa   |   Ar   |   En
   شناسایی احساس گفتار فارسی با روش تنظیم دقیق ترانسفرمرها  
   
نویسنده شایانی نسب مینو ,باباعلی باقر
منبع نهمين كنگره انجمن علوم صوتي ايران - 1402 - دوره : 9 - نهمین کنگره انجمن علوم صوتی ایران - کد همایش: 02230-83753 - صفحه:0 -0
چکیده    با توجه به اهمیت شناسایی احساس از روی صوت گفتار، در سال‌های اخیر روش‌های متعددی برای تولید سیستم‌های کارا و بهینه‌ در این حوزه توسعه داده شده است. از جمله‌ی این روش‌ها استفاده از ترنسفرمرهای پیش‌آموزش دیده‌ای هستند که مناسب این مسئله تنظیم دقیق می شوند و دقت بالایی هم به دست آورده اند. علی رغم بحث و تحقیقات زیاد در خصوص این سیستم ها و تلاش برای بهبود هرچه بیشتر آن ها در مقیاس جهانی، در مطالعات صوت و گفتار فارسی با هدف شناسایی احساس، به این رویکرد جدید و موثر کمتر پرداخته شده است. در این مقاله، ضمن مروری بر مسئله‌ی شناسایی احساس گفتار و پیشینه‌ی آن، به اهمیت به کارگیری ترنسفرمرها در این مسئله پرداخته می‌شود و و دو مدل یکی بر پایه‌ی طیف‌نگار و یکی بر پایه‌ی صوت مستقیم روی دادگان shemo تنظیم‌دقیق می‌شود. این مدل‌ها دقت‌های سیتستم‌های قبلی را روی دادگان ذکر شده از حدود 65 به 80 درصد ارتقا می‌دهد. در ادامه‌ی کار همان مدل‌های معرفی‌شده ابتدا با دادگان iemocap انگلیسی و سپس با دادگان shemo فارسی دو بار تنظیم دقیق می‌شود و از این طریق دقت سیستم شناسایی احساس فارسی ساخته‌شده تا 82 درصد بهبود می‌یابد.
کلیدواژه شناسایی احساس گفتار فارسی، shemo، یادگیری خودنظارتی
آدرس , iran, , iran
پست الکترونیکی babaali@ut.ac.ir
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved