|
|
شناسایی احساس گفتار فارسی با روش تنظیم دقیق ترانسفرمرها
|
|
|
|
|
نویسنده
|
شایانی نسب مینو ,باباعلی باقر
|
منبع
|
نهمين كنگره انجمن علوم صوتي ايران - 1402 - دوره : 9 - نهمین کنگره انجمن علوم صوتی ایران - کد همایش: 02230-83753 - صفحه:0 -0
|
چکیده
|
با توجه به اهمیت شناسایی احساس از روی صوت گفتار، در سالهای اخیر روشهای متعددی برای تولید سیستمهای کارا و بهینه در این حوزه توسعه داده شده است. از جملهی این روشها استفاده از ترنسفرمرهای پیشآموزش دیدهای هستند که مناسب این مسئله تنظیم دقیق می شوند و دقت بالایی هم به دست آورده اند. علی رغم بحث و تحقیقات زیاد در خصوص این سیستم ها و تلاش برای بهبود هرچه بیشتر آن ها در مقیاس جهانی، در مطالعات صوت و گفتار فارسی با هدف شناسایی احساس، به این رویکرد جدید و موثر کمتر پرداخته شده است. در این مقاله، ضمن مروری بر مسئلهی شناسایی احساس گفتار و پیشینهی آن، به اهمیت به کارگیری ترنسفرمرها در این مسئله پرداخته میشود و و دو مدل یکی بر پایهی طیفنگار و یکی بر پایهی صوت مستقیم روی دادگان shemo تنظیمدقیق میشود. این مدلها دقتهای سیتستمهای قبلی را روی دادگان ذکر شده از حدود 65 به 80 درصد ارتقا میدهد. در ادامهی کار همان مدلهای معرفیشده ابتدا با دادگان iemocap انگلیسی و سپس با دادگان shemo فارسی دو بار تنظیم دقیق میشود و از این طریق دقت سیستم شناسایی احساس فارسی ساختهشده تا 82 درصد بهبود مییابد.
|
کلیدواژه
|
شناسایی احساس گفتار فارسی، shemo، یادگیری خودنظارتی
|
آدرس
|
, iran, , iran
|
پست الکترونیکی
|
babaali@ut.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|