>
Fa   |   Ar   |   En
   پارامترهای آکوستیکی ریتم گفتار: سرنخ‌های آکوستیکی برای تشخیص گوینده  
   
نویسنده اسدی هما ,علی نژاد بتول
منبع پژوهش هاي زباني - 1400 - دوره : 12 - شماره : 2 - صفحه:29 -49
چکیده    مشخصه های ریتم گفتار بر اساس دیرش مناطق همخوانی، واک ه ای و نیز هجا می توانند گویشوران یک زبان خاص را از هم تمیز دهند. با وجود این، ریتم یک سیگنال آوایی تنها بر مبنای روابط دیرشی میان مناطق آوایی آن استوار نیست بلکه به تفاوت های مربوط به الگوی شدت در آن ها نیز بستگی دارد. پارامتر آکوستیکی شدت تا حد زیادی تحت تاثیر الگوهای حرکتی اندام های گفتار مانند حرکت لب ها و باز و بسته کردن دهان است. بنابراین انتظار می‌رود تفاوت های فردی در حرکت های اندام های گویایی و نیز تفاوت های آناتومیکِ مربوط به ساختار دستگاه آوایی افراد منجر به تغییر توزیع انرژی در سطح سیگنال و در نتیجه تغییر مقادیر شدت در سیگنال های آوایی افراد شود. در پژوهش حاضر قصد داریم با استفاده از ابزارهای آواشناسی آزمایشگاهی و با رویکرد تشخیص هویت گوینده پارامترهای اکوستیکی ریتم گفتار را بر مبنای مشخصه های شدت بنیاد در زبان فارسی بررسی کنیم. هدف این پژوهش بررسی توانایی پارامترهای شدت-بنیاد در سطح هجا جهت تشخیص هویت گویندگان فارسی‌زبان است. دو دسته از پارامترهای  شدت-بنیاد یکی بر مبنای میانگین شدت هجا (stdevm, varcom, rpvim, rpvim) و دیگری بر مبنای شدت قلۀ هجا (stdevp, varcop, rpvip, npvip) برای بررسی و تحلیل داده ها انتخاب شد. صدای دوازده گویشور مرد فارسی‌زبان در محیط آزمایشگاهی و در دو نوبت مجزا به فاصلۀ یک تا دو هفته ضبط شد. نمونه‌های آوایی با استفاده از برنامۀ praat ویرایش 34، 2، 5 مورد تجزیه‌وتحلیل آکوستیکی قرار گرفت و تحلیل آماری داده‌ها و مقادیر به‌دست‌آمده از بررسی آکوستیکی نمونه‌های آوایی با استفاده از نرم‌افزار spss ویرایش 0/21 و نرم‌افزار r ویرایش 3. 3. 3 صورت گرفت. نتایج نشان داد پارامترهای آکوستیکی ریتم گفتار بر مبنای نوسانات شدت نقش بسزایی در تشخیص هویت گویندگان فارسی زبان دارند. افزون بر آن، مشخصه‌های زبانویژه تاثیری در توانایی این پارامترها در تشخیص هویت گوینده ندارند. همچنین نتایج حاکی از آن بود که پارامترهای مبتنی بر شدت قلۀ هجا ویژگی‌های فرد ویژۀ بیشتری را انعکاس می دهند.
کلیدواژه آواشناسی آزمایشگاهی، ریتم گفتار، پارامترهای شدت-بنیاد، تشخیص
آدرس دانشگاه اصفهان, دانشکده زبان‌های خارجی, گروه زبان‌شناسی, ایران, دانشگاه اصفهان, دانشکده زبان های خارجی, گروه زبان شناسی, ایران
پست الکترونیکی b.alinezhad@fgn.ui.ac.ir
 
   Speech Rhythm Measures: Acoustic Cues for Speaker Identification  
   
Authors Asadi Homa ,alinezhad Batool
Abstract    Rhythmic characteristics of speech based on consonantal and vocalic intervals as well as syllabic intervals vary between speakers of the same language. Nonetheless, the rhythmicity of a speech signal is not solely dependent on the durational variability of phonetic intervals but it is also associated with the variability of the intensity patterns as well. Acoustic parameter of intensity is largely determined by the articulatory behaviors of the speech organs such as lip movement or mouth aperture. Therefore, it is plausible that speaker idiosyncrasy in movement of speech articulators and anatomical differences in individual’s vocal tracts may influence the energy distribution across a speech signal which subsequently leads to the variability in the values of the intensity measures. Using experimental phonetics tools and from an explicitly speakerspecific perspective, the present research attempts to explore potential speakerspecific acoustic parameters of speech rhythm which are extracted from the intensity contours across Persian speakers. This research aims to discover whether intensitybased measures of speech rhythm are able to discriminate between speakers in Persian. Two types of acoustic rhythmic measures based on the mean syllable intensity (stdevM, varcoM, rPVIm, nPVIm) and peak syllable intensity (stdevP, varcoP, rPVIp, nPVIp))  were selected for this study. Speech data from 12 Persian male speakers were recorded noncontemporaneously in laboratory environment on two different occasions separated by one to two weeks. Speech tokens were acoustically measured with PRAAT version 5.2.34 and statistical analyses were carried out with SPSS version 21 and R version 3.3.3. Results of the study indicated that speech rhythm measures based on intensity fluctuations play an important role in betweenspeaker rhythmic variability. In addition, discriminatory power of intensitybased measures is not affected by the languagedependent characteristics of Persian. The results also showed that the peak syllable intensity measures carry more speakerspecific information compared to the mean syllable intensity measures
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved