ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگی‌های ضرایب کپسترال نرمالیزه شده توانِ بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده

Fa | Ar | En

ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگی‌های ضرایب کپسترال نرمالیزه شده توانِ بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده


نویسنده	خلیل پور جعفر ,زارع زاده اسماعیل
منبع	علوم و فناوري هاي پدافند نوين - 1397 - دوره : 9 - شماره : 4 - صفحه:441 -448
چکیده	در این مقاله، یک الگوریتم استخراج ویژگیِ مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی فرکانسی به نام تبدیل شنوایی (at) و ضرایب کپسترال نرمالیزه شده توان(pncc)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد می گردد. به طور معمول عملکرد مدل های صوتی که توسط داده های بدون نویز(تمیز) آموزش داده می شوند، وقتی در شرایط نویزی مورد آزمایش قرار می گیرند به طور فزاینده ای کاهش می یابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توانِ مبتنی بر فیلتر کاکلی (cfpncc) نامیده می شود تحت چنین شرایطی مقاومت بالایی را از خود بروز می دهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیت های فیلتر بانک کاکلی با مزایای ویژگی pncc است که مقاومت توام در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. به گونه ای که آزمایش های انجام شده بر روی پایگاه دادگان استاندارد ssc نشان می دهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی pncc عمل می کند و به طور کلی نسبت به سایر ویژگی های متداول در زمینه تشخیص گوینده مانند mfcc و rastaplp در شرایط نویزی نرخ خطای پایین تری را داراست.
کلیدواژه	تصدیق گوینده، استخراج ویژگی، مقاوم به نویز.
آدرس	دانشگاه پدافند هوایی خاتم الانبیباء(ص), ایران, دانشگاه صنعتی امیرکبیر, ایران
پست الکترونیکی	zarezadeh@aut.ac.ir

Presenting A New Algorithm Based on GMM-UBM With Cochlear Filter- PNCC Feature for Speaker Verification

Authors	khalilpour jafar ,zarezadeh Esmail
Abstract	In this paper, an auditoryinspired feature extraction algorithm based on a recently published timefrequency transform, i.e., auditory transform (AT) and the power normalized cepstral coefficients (PNCC) is proposed. Usually, the performance of acoustic models trained in clean speech drops significantly when tested on noisy speech.The proposed feature, called Cochlear Filter PNCC (CFPNCC), has shown strong robustness in the acoustic mismatch situations. An important feature of the proposed algorithm is the combination of advantages of the cochlear filter with the advantages of the PNCC feature, which has the resistance to both stationary noise and nonstationary noise. As shown in our experiments, in a GMMUBM speaker verification system, CFPNCC outperforms the original PNCC and achieves the best overall results on the SSC database compared to the conventional features such as MFCC and RASTAPLP under noisy conditions.
Keywords	peaker Verification ,Feature Extraction ,Noise Robustness