>
Fa   |   Ar   |   En
   دسته‌بندی اصوات محیطی با استفاده از خوشه‌بندی و شبکه‌های عصبی عمیق پیچشی  
   
DOR 20.1001.2.9920064087.1399.4.1.40.4
نویسنده خبازان علیرضا ,مطلبی‌زاده حمیدرضا ,شکفته یاسر
منبع كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1399 - دوره : 4 - چهارمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 99200-64087
چکیده    در این مقاله روشی بر مبنای ترکیب یادگیری با نظارت و یادگیری غیر نظارتی برای دسته‌بندی اصوات محیطی مجموعه‌ی دادگان esc-10 معرفی می‌گردد که در آن تبدیل فوریه زمان کوتاه بر مبنای فرکانس مِل و لگاریتم اسپکتروگرام بر مبنای ضرایب مِل صدای وروی، استخراج شده و به الگوریتم خوشه‌بندیk-means داده می‌شود و به اعضای هر خوشه برچسبی خاص آن خوشه تعلق می‌گیرد، سپس داده‌ی ورودی به همراه برچسب‌های جدید خود به عنوان ورودی به یک شبکه‌ی عصبی عمیق پیچشی داده می‌شود. این روش در کنار استفاده از داده‌افزایی در جهت افزایش نمونه‌‌های آموزشی، توانست عملکرد بسیار خوبی از خود نشان دهد و بر روی مجموعه‌ی دادگانesc-10 به دقت میانگین 1/91 درصد بر روی دسته‌های مختلف دست یابد.
کلیدواژه صدای محیط ,esc-10 ، cnn ,k-means ,خوشه‌بندی ,شبکه عصبی پیچشی
آدرس دانشگاه شهید بهشتی, ایران, دانشگاه شهید بهشتی, ایران, دانشگاه شهید بهشتی, ایران
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved