طراحی و ضبط پایگاه‌دادگان گفتاری برای سیستم‌های تبدیل متن به گفتار فارسی

Fa | Ar | En

طراحی و ضبط پایگاه‌دادگان گفتاری برای سیستم‌های تبدیل متن به گفتار فارسی


نویسنده	طاهری اردلی مرتضی ,خرم سهیل ,عاصی مصطفی ,صامتی حسین ,بی جن خان محمود
منبع	پژوهش هاي زبان شناسي تطبيقي - 1395 - دوره : 6 - شماره : 12 - صفحه:69 -84
چکیده	مقاله حاضر به ارائه روشی برای طراحی و ساختِ پایگاه‌دادگانی مختص سیستم‌های تبدیل متن به گفتار با در نظر گرفتن ساخت نوایی فارسی می‌پردازد. این مجموعه به لحاظ آوایی و نوایی غنی و مشتمل بر 2826 نمونه جمله فارسی است. این نمونه جملات در شرایط استودیو و با تک‌صدای گوینده خانم که به صورت حرفه‌ای در زمینه صدا فعالیت می‌کند ضبط شده است. پوشش حالت‌های مختلف نوایی در کنار پوشش حالت‌های مختلف آوایی از نقاط قوت این پایگاه است که برای نخستین بار در سیستم‌های تبدیل متن به گفتارِ فارسی لحاظ می‌شود. این مجموعه در کنار فایل‌های صوتی، دارای برچسب‌های متن و صورت آوایی است که به صورت دستی اصلاح شده‌‌اند. در نهایت، با بکارگیری مجموعه دادگان مذکور و با استفاده از روش بازسازی گفتار آماری ـ پارامتری ساخت صدا انجام گرفت. آزمودنی‌ها کیفیت صدای ساخته‌شده را با استفاده از معیار میانگینِ امتیازاتِ نظردهی (mos) 4.3 ارزیابی کردند.
کلیدواژه	پایگاه‌دادگان گفتاری، تبدیل متن به گفتار، نوای گفتار، پیکره متنی
آدرس	دانشگاه شهرکرد, ایران, دانشگاه صنعتی شریف, ایران, پژوهشگاه علوم انسانی و مطالعات فرهنگی, ایران, دانشگاه صنعتی شریف, ایران, دانشگاه تهران, ایران
پست الکترونیکی	mbjkhan@ut.ac.ir

Designing and Recording a Speech Database for Persian TTS Systems

Authors	Taheri-Ardali Mortaza ,Khorram Soheil ,Assi Mostafa ,Sameti Hossein ,Bijankhan Mahmood