|
|
پارامترهای دیرش - بنیاد ریتم گفتار، سنجهای برای تشخیص تقلب فارسیزبانان در گفتار؟
|
|
|
|
|
نویسنده
|
آسیائی مارال ,نوربخش ماندانا
|
منبع
|
پژوهش هاي زباني - 1399 - دوره : 11 - شماره : 1 - صفحه:1 -23
|
چکیده
|
پژوهش حاضر با استفاده از رویکردی شنیداری صوتشناختی به بررسی امکان استفاده از پارامترهای صوتشناختی و دیرشبنیاد ریتم گفتار در تشخیص تقلب فارسیزبانان در تولید گونه ترکی آذری میپردازد. از اینرو، گفتار پیوسته و محاورهای پنج گویشور زبان فارسی معیار و پنج گویشور ترکی آذری گونه تبریزی پس از انجام مراحل اعتبارسنجی مورد تجزیهوتحلیل صوتشناختی و آماری قرار گرفت. تمامی گویشوران فارسی تکزبانه و گویشوران ترکی آذری دوزبانه (ترکی آذری و فارسی) بودند. از هر یک از گویشوران فارسیزبان درخواست شد تا ابتدا خاطرهای را به زبان فارسی (فارسی فارسی) و سپس همان خاطره را به صورت تقلیدی از ترکی آذری (فارسی ترکی) بیان نمایند. از گویشوران ترکی آذری نیز درخواست شد تا خاطرهای را یکبار به ترکی آذری (ترکی ترکی) و بار دیگر به فارسی (ترکیفارسی) نقل کنند. دادههای فارسی ترکی، دادههایی هستند که در این پژوهش به عنوان دادههای تقلب فارسیزبانان از ترکی آذری شناخته میشوند. پس از ضبط دادهها، نمونههای صوتی در پنج لایه برچسبگذاری شدند. به منظور یکسانسازی و حذف هرگونه متغیر اضافی از نمونههای آوایی، حدود یک دقیقه (با انحراف معیار ± 5 ثانیه) از گفتار گویشوران، به منظور انجام بررسیهای صوتشناختی و آماری انتخاب گردید. پارامترهای صوتشناختی و دیرش بنیاد ریتم گفتار با استفاده از برنامه خودکار تجزیه و تحلیل دیرش استخراج و مورد واکاوی قرار گرفتند. این پارامترها عبارتاند از: میزان واکهای بودن گفتار، انحراف معیار دیرش مناطق همخوانی و واکهای نرمالسازی شده، شاخص تغییر دو به دوی واکهای نرمالسازی شده و سرعت تولید. نتایج بررسی آماری که با استفاده از نرمافزار آماری اسپیاساس انجام شد، نشان داد که پارامترهای مناسب در ایجاد تمایز میان انواع دادههای پژوهش حاضر، پارامترهای میزان واکهای بودن گفتار و سرعت تولید هستند. اگرچه، این دو پارامتر در ایجاد تمایز کلی میان انواع دادههای این پژوهش موفق عمل کردهاند، هیچکدام از این پارامترها توانایی ایجاد تمایز میان دادههای ترکی فارسی و فارسی ترکی را نداشتند.
|
کلیدواژه
|
تقلب در گفتار، ریتم گفتار، پارامترهای دیرش - بنیاد، آواشناسی قضایی، زبان فارسی، ترکی آذری گونه تبریزی
|
آدرس
|
دانشگاه الزهرا (س), ایران, دانشگاه الزهرا (س), ایران
|
پست الکترونیکی
|
nourbakhsh@alzahra.ac.ir
|
|
|
|
|
|
|
|
|
Durational Parameters of Speech Rhythm, A Measure for Detection of the Persian Speakers’ Use of Disguise?
|
|
|
Authors
|
|
Abstract
|
Using the auditoryacoustic approach, the present study examines the possibility of using durational acoustic parameters of speech rhythm for detecting the Persian speakers’ use of Azeri as a form of voice disguise. To do so, continuous speech of 5 speakers of Standard Persian and 5 speakers of Azeri, Tabrizi variety, were chosen for the acoustic and statistical analysis after completing the validity procedures. All Persian speakers were monolingual and all Azeri speakers were bilingual speakers of Azeri and Persian, who spoke Azeri as their mother tongue and Persian as their second language. Each Persian speaker was asked to narrate a lifetime experience once in Persian (Persian Persian data), and once as an imitation of Azeri (Persian Azeri data). Azeri speakers were also asked to narrate a lifetime experience once in Azeri (Azeri Azeri data) and once in Persian (AzeriPersian Data). PersianAzeri data is the type that is considered as the disguised data in this survey. The recorded data were then annotated in five tiers: segment, CVsegment, CVsegment interval, CVinterval and syllable. In order to control the effect of any unwanted variable, one minute (±5 seconds SD) of each sound file was extracted for further acoustic and statistical analyses. A Praat script, DurationAnalyzer, was used to automatically calculate the acoustic correlates of durational parameters of speech rhythm. These parameters are: %V (the proportion which speech is vocalic), ΔC (ln) (standard deviation of the naturallog normalized duration of consonantal intervals), ΔV (ln) (standard deviation of the naturallog normalized duration of vocalic intervals), nPVI V (ratenormalized averaged durational differences between consecutive vocalic intervals) and syllable rate. Results revealed there was a significant difference between the proposed types of data and that%V and syllable rate best discriminated between them; however, none of the abovementioned parameters were significantly different between PersianAzeri and AzeriPersian data.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|