مقایسه روش های طیفی برای شناسایی زبان گفتاری

Fa | Ar | En

مقایسه روش های طیفی برای شناسایی زبان گفتاری


نویسنده	رضا شقایق ,کبودیان جهانشاه
منبع	پردازش علائم و داده ها - 1396 - دوره : 14 - شماره : 1 - صفحه:111 -134
چکیده	شناسایی خودکار زبان گفتاری به تشخیص زبان از روی سیگنال گفتار گفته می شود. شناسایی زبان به طورمعمول به یکی از دو دسته روش آوایی و طیفی انجام می شود. در این مقاله، انواع روش های مختلف طیفی برای بازشناسی زبان گفتاری معرفی شده و نتایج به کارگیری آنها بر روی یک مجموعه دادگان گفتاری تلفنی محاوره ای مقایسه شده است. روش طیفی پایۀ شناسایی زبان، مدل مخلوط گوسیمدل جهانی (gmm-ubm) است. برای بهبود مدل گوسی هر زبان از روش تمایزی mmi و برای مدل کردن دینامیک زبان از مدل پنهان مارکوف ارگودیک (ehmm) استفاده می شود. روش های gsv-svm و روش نشانه گذار مبتنی بر gmm )gmm tokenizer) نیز دو روش طیفی دیگر است که مورد بررسی قرار گرفته است. در این مقاله همچنین روش های جدیدِ مدل سازی تنوعات کانال و گوینده (تحلیل توام عامل ها (jfa) و بردار شناسایی (ivector)) به کار رفته و برای بهبود نتایج آن از چند روش جبران سازی تنوعات استفاده شده است. علاوه براین برای سهولت تصمیم گیری و کاهش خطای سامانۀ شناسایی زبان، از پس پردازش امتیاز استفاده شده است. این مقاله بخشی از هفت سال پژوهش در زمینه شناسایی زبان گفتاری در پژوهشگاه توسعه فناوری های پیشرفته خواجه نصیرالدین طوسی است و تنها خلاصه ای از روش ها و نتایج به دست آمده در این مقاله آورده شده است.
کلیدواژه	شناسایی خودکار زبان گفتاری، روش‌های طیفی، آموزش تمایزی، جبران‌سازی تنوعات کانال، بردار شناسایی.
آدرس	پژوهشگاه توسعه فناوری‌های پیشرفته خواجه‌نصیرالدین طوسی, پژوهشکده پردازش داده, ایران, دانشگاه رازی, دانشکده فنی و مهندسی, گروه مهندسی کامپوتر و فناوری اطلاعات, ایران
پست الکترونیکی	kabudian@razi.ac.ir

A survey on spectral methods in spoken language identification

Authors	reza shaghayegh ,kabudian jahanshah