|
|
یک روش سریع برای تقطیع گفتار گویندگان بر اساس بسامد گام گفتار (RPSS)
|
|
|
|
|
نویسنده
|
عبدالعلی بهروز ,صامتی حسین ,قزل ایاغ محمدحسین
|
منبع
|
علوم و فناوري هاي پدافند نوين - 1391 - دوره : 3 - شماره : 1 - صفحه:29 -38
|
چکیده
|
تقطیع و خوشه بندی گویندگان فرآیندی است که طی آن قطعه بندی و برچسب گذاری برای گفتار حاصل از یک جلسه که شامل چند گوینده است انجام میشود و دنباله صوتی به بخشهایی تقسیم میشود که هر بخش شامل فقط یک گوینده است و با برچسب گذاری مشخص میشود که هر بخش مربوط به کدام گوینده است. تشخیص فعالیت گفتاری، تقطیع گفتار و خوشه بندی گویندگان، حداقل مراحل اصلی سامانه های تقطیع و خوشه بندی گفتار بر اساس گوینده محسوب می شوند. برای مرحله ی تقطیع روشهای متعددی وجود دارد که تقطیع بر مبنای bic یکی از روشهای مرسوم است. این روش به دلیل محاسبات آماری آن، نیاز به زمان محاسبات طولانی دارد. هدف اصلی این مقاله ارایه ی روش تقطیع بر اساس بسامد گام گفتار است، که هم دارای دقتی در حد روشهای مرسوم است و هم دارای سرعت محاسبات بالا است، به طوری که در مقایسه با تقطیع بر اساس bic به طور میانگین دارای مزیت 4/2 برابری در سرعت و افزایش یک درصد در دقت است.
|
کلیدواژه
|
تقطیع و خوشه بندی گویندگان ,تقطیع گفتار ,بسامد گام گفتار
|
آدرس
|
دانشگاه جامع امام حسین (ع), ایران, دانشگاه صنعتی شریف, ایران, دانشگاه جامع امام حسین (ع), ایران
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|