پارامترهای دیرش - بنیاد ریتم گفتار، سنجه‌ای برای تشخیص تقلب فارسی‌زبانان در گفتار؟

Fa | Ar | En

پارامترهای دیرش - بنیاد ریتم گفتار، سنجه‌ای برای تشخیص تقلب فارسی‌زبانان در گفتار؟


نویسنده	آسیائی مارال ,نوربخش ماندانا
منبع	پژوهش هاي زباني - 1399 - دوره : 11 - شماره : 1 - صفحه:1 -23
چکیده	پژوهش حاضر با استفاده از رویکردی شنیداری صوت‌شناختی به بررسی امکان استفاده از پارامترهای صوت‌شناختی و دیرش‌بنیاد ریتم گفتار در تشخیص تقلب فارسی‌زبانان در تولید گونه ترکی آذری می‌پردازد. از این‌رو، گفتار پیوسته و محاوره‌ای پنج گویشور زبان فارسی معیار و پنج گویشور ترکی آذری گونه تبریزی پس از انجام مراحل اعتبارسنجی مورد تجزیه‌وتحلیل صوت‌شناختی و آماری قرار گرفت. تمامی گویشوران فارسی تک‌زبانه و گویشوران ترکی آذری دوزبانه (ترکی آذری و فارسی) بودند. از هر یک از گویشوران فارسی‌زبان درخواست شد تا ابتدا خاطره‌ای را به زبان فارسی (فارسی فارسی) و سپس همان خاطره را به صورت تقلیدی از ترکی آذری (فارسی ترکی) بیان نمایند. از گویشوران ترکی آذری نیز درخواست شد تا خاطره‌ای را یک‌بار به ترکی آذری (ترکی ترکی) و بار دیگر به فارسی (ترکیفارسی) نقل کنند. داده‌های فارسی ترکی، داده‌هایی هستند که در این پژوهش به عنوان داده‌های تقلب فارسی‌زبانان از ترکی آذری شناخته‌ می‌شوند. پس از ضبط داده‌ها، نمونه‌های صوتی در پنج لایه برچسب‌گذاری شدند. به منظور یکسان‌سازی و حذف هرگونه متغیر اضافی از نمونه‌های آوایی، حدود یک دقیقه (با انحراف معیار ± 5 ثانیه) از گفتار گویشوران، به منظور انجام بررسی‌های صوت‌شناختی و آماری انتخاب گردید. پارامترهای صوت‌شناختی و دیرش بنیاد ریتم گفتار با استفاده از برنامه خودکار تجزیه و تحلیل دیرش استخراج و مورد واکاوی قرار گرفتند. این پارامترها عبارت‌اند از: میزان واکه‌ای بودن گفتار، انحراف معیار دیرش مناطق همخوانی و واکه‌ای نرمال‌سازی شده، شاخص تغییر دو به دوی واکه‌ای نرمال‌سازی شده و سرعت تولید. نتایج بررسی آماری که با استفاده از نرم‌افزار آماری اس‌پی‌اس‌اس انجام شد، نشان داد که پارامترهای مناسب در ایجاد تمایز میان انواع داده‌های پژوهش حاضر، پارامترهای میزان واکه‌ای بودن گفتار و سرعت تولید هستند. اگرچه، این دو پارامتر در ایجاد تمایز کلی میان انواع داده‌های این پژوهش موفق عمل‌ کرده‌اند، هیچ‌کدام از این پارامترها توانایی ایجاد تمایز میان داده‌های ترکی فارسی و فارسی ترکی را نداشتند.
کلیدواژه	تقلب در گفتار، ریتم گفتار، پارامترهای دیرش - بنیاد، آواشناسی قضایی، زبان فارسی، ترکی آذری گونه تبریزی
آدرس	دانشگاه الزهرا (س), ایران, دانشگاه الزهرا (س), ایران
پست الکترونیکی	nourbakhsh@alzahra.ac.ir

Durational Parameters of Speech Rhythm, A Measure for Detection of the Persian Speakers’ Use of Disguise?

Authors
Abstract	Using the auditoryacoustic approach, the present study examines the possibility of using durational acoustic parameters of speech rhythm for detecting the Persian speakers’ use of Azeri as a form of voice disguise. To do so, continuous speech of 5 speakers of Standard Persian and 5 speakers of Azeri, Tabrizi variety, were chosen for the acoustic and statistical analysis after completing the validity procedures. All Persian speakers were monolingual and all Azeri speakers were bilingual speakers of Azeri and Persian, who spoke Azeri as their mother tongue and Persian as their second language. Each Persian speaker was asked to narrate a lifetime experience once in Persian (Persian Persian data), and once as an imitation of Azeri (Persian Azeri data). Azeri speakers were also asked to narrate a lifetime experience once in Azeri (Azeri Azeri data) and once in Persian (AzeriPersian Data). PersianAzeri data is the type that is considered as the disguised data in this survey. The recorded data were then annotated in five tiers: segment, CVsegment, CVsegment interval, CVinterval and syllable. In order to control the effect of any unwanted variable, one minute (±5 seconds SD) of each sound file was extracted for further acoustic and statistical analyses. A Praat script, DurationAnalyzer, was used to automatically calculate the acoustic correlates of durational parameters of speech rhythm. These parameters are: %V (the proportion which speech is vocalic), ΔC (ln) (standard deviation of the naturallog normalized duration of consonantal intervals), ΔV (ln) (standard deviation of the naturallog normalized duration of vocalic intervals), nPVI V (ratenormalized averaged durational differences between consecutive vocalic intervals) and syllable rate. Results revealed there was a significant difference between the proposed types of data and that%V and syllable rate best discriminated between them; however, none of the abovementioned parameters were significantly different between PersianAzeri and AzeriPersian data.
Keywords