بهبود سامانه های تصدیق هویت گوینده برای گفتارهای آلوده به نویز با استفاده از بردارهای هویت موزون
|
|
|
|
|
نویسنده
|
محمدی محسن ,صادقمحمدی حمیدرضا
|
منبع
|
علوم رايانش و فناوري اطلاعات - 1398 - دوره : 17 - شماره : 2 - صفحه:62 -71
|
چکیده
|
دسترسی ایمن به سامانههای کاربردی متفاوت از فواصل دور و نزدیک، کاربرپسند بودن، پیچیدگی محاسباتی کم و هزینه پیادهسازی پایین از ویژگیهای برجسته روش تصدیق هویت مبتنی بر گفتار است. اما کارایی این شیوه در محیطهای واقعی به دلیل وجود نویزهای متفاوت صوتی و عوارض کانال بهشدت افت میکند. روش ivector plda ازجمله شیوههای موفق در بهبود عملکرد سامانههای تصدیق هویت گوینده است. در این مقاله بهرهمندی از ویژگیهای آماری بردارهای ثبتنام گویندگان هدف برای وزندهی به بردارهای مدل و تست، جهت بهبود دقت امتیازدهی و درنتیجه عملکرد سامانه تصدیق هویت در شرایط آزمون گفتار نویزی پیشنهاد گردیده است. تاثیر استفاده از این بردارهای وزن داده شده، که آن را بردارهای موزون نامیدهایم، بر عملکرد سامانه در محیطهای نویزی مورد ارزیابی قرار گرفته است. آموزشها و آزمونها با استفاده از دادگان گفتار timit، بردارهای ویژگی mfcc و pncc و روش امتیازدهی plda انجام شده است. همچنین برای بهبود عملکرد سامانه در شرایط عدم تطابق نویز، بین گفتار ثبتنام و آزمون، از آموزش چندشرطی برای lda و plda استفاده شده است. همچنین ترکیب امتیازات این آزمونها نیز مورد ارزیابی قرار گرفت. نتایج آزمونها مبین آن است که بهرهگیری از بردارهای موزون دقت سامانه تصدیق هویت گوینده را برای گفتارهای نویزی نیز افزایش میدهد، علاوه بر آن در اکثر قریب به اتفاق موارد ترکیب امتیازات آزمونها نیز عملکرد سامانه را بهبود می بخشد.
|
کلیدواژه
|
تصدیق هویت گوینده، وزندهی بردار، نویز، بردار هویت، plda ، multi-condition ، i-vector
|
آدرس
|
جهاد دانشگاهی, پژوهشکده برق, ایران, جهاد دانشگاهی, پژوهشکده برق, ایران
|
پست الکترونیکی
|
mohammadis@acecr.ac.ir
|
|
|
|
|