|
|
ارائه یک مدل پارامتریک تطبیقی جهت کشف و ردهبندی وقایع صوتی در سیگنالهای محیطی
|
|
|
|
|
نویسنده
|
درخشان مراد ,مروی حسین ,حسن پور حمید
|
منبع
|
مهندسي برق دانشگاه تبريز - 1398 - دوره : 49 - شماره : 2 - صفحه:565 -576
|
چکیده
|
کشف وقایع صوتی در محیط کار و زندگی یک نیاز مدرن جهت گردآوری اطلاعات است. تاکنون بیشتر تحقیقها بر واقعه صوتی خاص و یا تعداد محدودی از وقایع صوتی برجسته متمرکز بودهاست. در اینجا یک مدلسازی جدید جهت کشف تمام وقایع صوتی رخداده در رکورد و تعیین محدوده زمانی برای هر یک از آنها ارائه شدهاست. نوآوری شامل مدلسازی جدید همراه با پارامترهای تطبیقی در مدل است. پس از استخراج ویژگیها و تعیین مقادیر دو پارامتر آلفا و بتا از دو قطعهبندی مجزا و ترکیب خروجی آنها برای تعیین وقایع صوتی و محدوده زمانی آنها استفاده شدهاست. این وقایع جهت ردهبندی به الگوریتم knn فرستاده میشوند. پارامترها امکان دقت بیشتر و یا میزان کشف حداکثری را ممکن میسازند. وقایع صوتی آزمایششده شامل 16 نوع صدای اتاق کار اداری هستند که برخی شبیه هم و بعضی نیز مشابه نویز محیط هستند. در سنجش عملکرد برحسب واقعه، میزان درستی کشف 70.1 درصد، فراخوانی 75.8 درصد و میزان f1، 72.8 درصد بودهاست. همچنین میزان f1 برحسب فریم 80.6 درصد حاصل شد. مقدار f1 برحسب واقعه، نسبت به قبل 10.8% بهبود داشتهاست که مویدکارآمدی مدل پیشنهادی است.
|
کلیدواژه
|
کشف وقایع صوتی، صداهای محیطی، الگوریتمهای یادگیری بدون نظارت، سیستمهای پارامتریک تطبیقی، سیستمهای نظارت صوتی، سیستمهای کسب اطلاعات مبتنی بر صدا
|
آدرس
|
دانشگاه صنعتی شاهرود, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, ایران
|
پست الکترونیکی
|
h.hassanpour@shahroodut.ac.ir
|
|
|
|
|
|
|
|
|
Providing an Adaptive Model with two Adjustable Parameters for Audio Event Detection and Classification in Environmental Signals
|
|
|
Authors
|
Derakhshan M. ,Marvi H. ,Hassan poor H.
|
Abstract
|
Audio event detection (AED) is a modern way to collect data about human activities in the workplace or in other life environments. We proposed a novel adaptable model based on using two parameters, α and ᵦ to detect all audio events that may be present in a given record accompanied by their time limits in which they occur. After feature extraction and setting the values of the two key parameters, alpha and beta, the audio sequence will be sent into two distinct subsystems for event detection. The outputs from the two subclassifiers are then combined and necessary refinements are made on the event time limits. The final detected events are sent to the KNN classifier. The parameters serve as a tradeoff tool between precision and recall expectation in the detection process. In the tests, 16 different audio events of an office room were detected, some being similar to each other and some have very similar characteristics to those of the background noise. At framebased (FB) level, the precision rate was 70.1%, the rate of recall was 75.8%, and F1measure was 72.8%. The F1measure has increased by 10.8% suggesting promising applications of the model.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|