|
|
تحلیل اثر هندسه آرایه میکروفنی بر بهبود تشخیص گفتار دوردست
|
|
|
DOR
|
20.1001.2.9920027388.1399.17.1.15.3
|
نویسنده
|
صادقی سارا ,علی محمدی امیرحسین ,عسگری محمد ,صادقی محمدابراهیم ,محرابی کیا محمدصادق
|
منبع
|
اجلاس فناوري رسانه - 1399 - دوره : 17 - هفدهمین اجلاس فناوری رسانه - کد همایش: 99200-27388
|
چکیده
|
تشخیص گفتار از راه دور (dsr) یک فناوری اساسی و رابط طبیعی میان انسان و ماشین است. علی رغم پیشرفت های چشمگیر اخیر در زمینه های مختلف، از جمله فیلترینگ فضایی، جداسازی منبع، حذف واخنش گفتار و مکان-یابی گوینده، dsr هنوز فاقد مقاومت کافی می باشد، به ویژه هنگامی که شرایط نامطلوب صوتی ناشی از نویزهای ناایستان و واخنش صدا حاصل شود. در ادبیات dsr ، نتایج بدست آمده بیشتر با آرایه های خطی یا دایروی گزارش شده است. و بنابراین بحث تاثیر هندسه آرایه کماکان بحثی چالش برانگیز در این حوزه می باشد. در این مقاله به بررسی چهار نوع آرایه خطی یکنواخت، آرایه دایروی و دو دایره متحدالمرکز و در نهایت آرایه کروی پرداخته شد و الگوریتم های بیم فرمینگ متفاوت بررسی شد. نرخ خطای کلمه یک میکروفون منفرد از یک آرایه میکروفنی، با استفاده از یک سیستم بازشناسی گفتار معادل با 35.74% بدست آمد که این مقدار، مرجع مقایسه با هندسه های دیگر، قرار داده شد. بر اساس نتایج و با مقایسه عملکرد آرایه های مذکور نشان داده شده است که یک آرایه کروی با قطر 8.4 سانتی متر و 32 میکروفون می تواند دقت تشخیص %6.5 درصد ارائه دهد که این مقدار قابل مقایسه یا بهتر از آنچه که توسط دیگر هندسه های آرایه حاصل می شود، می باشد.
|
کلیدواژه
|
تشخیص گفتار ,گوینده دوردست ,آرایه میکروفونی ,آرایه کروی ,بیم فرمینگ
|
آدرس
|
دانشگاه صدا و سیما, ایران, دانشگاه صدا و سیما, ایران, دانشگاه صدا و سیما, ایران, دانشگاه صدا و سیما, ایران, دانشگاه صدا و سیما, ایران
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|