|
|
طراحی و ضبط پایگاهدادگان گفتاری برای سیستمهای تبدیل متن به گفتار فارسی
|
|
|
|
|
نویسنده
|
طاهری اردلی مرتضی ,خرم سهیل ,عاصی مصطفی ,صامتی حسین ,بی جن خان محمود
|
منبع
|
پژوهش هاي زبان شناسي تطبيقي - 1395 - دوره : 6 - شماره : 12 - صفحه:69 -84
|
چکیده
|
مقاله حاضر به ارائه روشی برای طراحی و ساختِ پایگاهدادگانی مختص سیستمهای تبدیل متن به گفتار با در نظر گرفتن ساخت نوایی فارسی میپردازد. این مجموعه به لحاظ آوایی و نوایی غنی و مشتمل بر 2826 نمونه جمله فارسی است. این نمونه جملات در شرایط استودیو و با تکصدای گوینده خانم که به صورت حرفهای در زمینه صدا فعالیت میکند ضبط شده است. پوشش حالتهای مختلف نوایی در کنار پوشش حالتهای مختلف آوایی از نقاط قوت این پایگاه است که برای نخستین بار در سیستمهای تبدیل متن به گفتارِ فارسی لحاظ میشود. این مجموعه در کنار فایلهای صوتی، دارای برچسبهای متن و صورت آوایی است که به صورت دستی اصلاح شدهاند. در نهایت، با بکارگیری مجموعه دادگان مذکور و با استفاده از روش بازسازی گفتار آماری ـ پارامتری ساخت صدا انجام گرفت. آزمودنیها کیفیت صدای ساختهشده را با استفاده از معیار میانگینِ امتیازاتِ نظردهی (mos) 4.3 ارزیابی کردند.
|
کلیدواژه
|
پایگاهدادگان گفتاری، تبدیل متن به گفتار، نوای گفتار، پیکره متنی
|
آدرس
|
دانشگاه شهرکرد, ایران, دانشگاه صنعتی شریف, ایران, پژوهشگاه علوم انسانی و مطالعات فرهنگی, ایران, دانشگاه صنعتی شریف, ایران, دانشگاه تهران, ایران
|
پست الکترونیکی
|
mbjkhan@ut.ac.ir
|
|
|
|
|
|
|
|
|
Designing and Recording a Speech Database for Persian TTS Systems
|
|
|
Authors
|
Taheri-Ardali Mortaza ,Khorram Soheil ,Assi Mostafa ,Sameti Hossein ,Bijankhan Mahmood
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|