تشخیص احساس از سیگنال گفتار به کمک روش های افزایش داده متخاصمی
|
|
|
DOR
|
20.1001.2.9920177913.1400.20.1.14.0
|
نویسنده
|
شیلاندری آرش ,مروی حسین ,خسروی حسین
|
منبع
|
كنفرانس ملي دانشجويي مهندسي برق ايران - 1400 - دوره : 20 - بیستمین کنفرانس ملی دانشجویی مهندسی برق ایران - کد همایش: 99201-77913
|
چکیده
|
امروزه با ماشینی شدن زندگی روزمره، پردازش گفتار برای تعامل بین انسان و ماشین از اهمیت بالایی برخوردار شده است. تشخیص احساسات از گفتار ، برای درک دقیق معانی جملات و همچنین ایجاد واکنش مناسب به گوینده، از سوی ماشین ضروری است. احساس به عوامل متعددی از جمله جنسیت، تن صدا، زبان و برخی ویژگی های فردی وابسته است که کار تشخیص آن را سخت می کند. هرچه ویژگی های استخراج شده از گفتار بیشتر باشد، نیاز به داده های بیشتری برای آموزش شبکه عصبی می باشد و تنها در صورت وجود داده به تعداد کافی، منجر بهدقت بهتر در طبقهبندی می شود. یکی از عمدهترین مشکلات موجود در تشخیص احساس از گفتار، کمبود داده در هر کلاس جهت آموزش شبکه عصبی است. در صورت عدم وجود تعداد زیاد داده می توان از روش های افزایش داده استفاده کرد. این مقاله با هدف ایجاد یک شبکه مولد متخاصمی جهت افزایش داده ها در یک سیستم تشخیص احساس از گفتار متمرکز شده است. برای هر احساس بهصورت جداگانه یک شبکه مولد متخاصمی پیشنهاد می شود که از یک سو شباهت بین نمونه های واقعی و تولید شده را تضمین کند و از طرف دیگر باعث ایجاد تمایز عاطفی در بین نمونه های تولید شده بین کلاس های مختلف شود. کیفیت داده های مصنوعی در هر دو آزمایش درون کلاسی و بین کلاسی مورد ارزیابی قرار می گیرد و علاوه بر این، تلاش می شود با استخراج و تکثیر ویژگی های سطح بالا از ویژگی های صوتی گفتار، تشخیص احساس از گفتار با پنج کلاس احساسی با دقت بالاتری صورت پذیرد.
|
کلیدواژه
|
تشخیص احساس از گفتار ,افزایش داده ,یادگیری عمیق ,شبکههای مولد متخاصمی
|
آدرس
|
دانشگاه صنعتی شاهرود, ایران, دانشگاه صنعتی شاهرود, ایران, دانشگاه صنعتی شاهرود, ایران
|
|
|
|
|
|
|