>
Fa   |   Ar   |   En
   شناسایی احساس سیگنال گفتار فارسی با استفاده از تحلیل ویژگی‌های طیفی-فرکانسی  
   
نویسنده مومنی مریم
منبع صنايع الكترونيك - 1398 - دوره : 10 - شماره : 2 - صفحه:59 -70
چکیده    امروزه تشخیص احساس از گفتار در مواردی که ارتباط متقابل انسان و ماشین وجود دارد مورد توجه قرار گرفته است. با وجود تلاش‌های زیاد در این زمینه همچنان فاصله زیادی بین احساسات طبیعی انسان و درک کامپیوتر نسبت به آن وجود دارد. دلیل اصلی این موضوع نیز عدم توانایی رایانه در درک احساس کاربر است. هدف از این مقاله، طراحی یک سیستم تشخیص احساس از گفتار بر روی پایگاه داده گفتار احساسی فارسی که شامل 5 احساس خوشحالی، تنفر، ترس، ناراحتی و عصبانیت است. در این مقاله، پس از استخراج داده‌های چهار بعدی مقیاس، نرخ (سرعت)، زمان و فرکانس گفتار به کمک سیستم مدل شنوایی گوش انسان، داده دو بعدی مقیاس و فرکانس حاصل شد که بیشینه مقدار این داده‌ها به‌عنوان بردار ویژگی استفاده شد. در نهایت با استفاده از طبقه‌بند ماشین بردار پشتیبان احساس این پایگاه داده طبقه‌بندی شدند. نتایج آزمایش‌ها نشان می‌دهد الگوریتم پیشنهادی عملکرد قابل قبولی در مقایسه با سیستم‌های تشخیص خودکار احساسات از گفتار در زبان فارسی ارائه می‌دهد.
کلیدواژه شناسایی خودکار احساس، گفتار زبان فارسی، ویژگی‌های طیفی-فرکانسی
آدرس دانشگاه اراک, دانشکده فنی و مهندسی اراک, گروه مهندسی برق, ایران
پست الکترونیکی m-momeni@araku.ac.ir
 
   Speech Emotion Recognition in Persian using SpectroTemporal Features  
   
Authors Momeni Maryam
Abstract    These days, speech emotion recognition has considered in the cases where there is a relationship between man and machine. Despite many efforts in this field, there is still a great gap between the natural feelings of humans and the computer’s perception of it. The main reason for this is the inability of the computer to understand the user’s feelings. The purpose of this paper is to design a system to recognize Persian emotional speech database, which includes five emotions of happiness, exhausting, fear, anger and sadness. In this paper, after extraction of fourdimensional features of scale, rate (speed), time and speech frequency with the help of the human auditory model system, twodimensional features of the scale and frequency was obtained that the maximum amount of these features was used as a feature vector. Finally, the extracted features were classified using support vector machine. The results of the experiments show that the proposed algorithm provides acceptable performance compared to automatic speech emotion recognition in Persian.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved