دستهبندی اصوات محیطی با استفاده از خوشهبندی و شبکههای عصبی عمیق پیچشی
|
|
|
DOR
|
20.1001.2.9920064087.1399.4.1.40.4
|
نویسنده
|
خبازان علیرضا ,مطلبیزاده حمیدرضا ,شکفته یاسر
|
منبع
|
كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1399 - دوره : 4 - چهارمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 99200-64087
|
چکیده
|
در این مقاله روشی بر مبنای ترکیب یادگیری با نظارت و یادگیری غیر نظارتی برای دستهبندی اصوات محیطی مجموعهی دادگان esc-10 معرفی میگردد که در آن تبدیل فوریه زمان کوتاه بر مبنای فرکانس مِل و لگاریتم اسپکتروگرام بر مبنای ضرایب مِل صدای وروی، استخراج شده و به الگوریتم خوشهبندیk-means داده میشود و به اعضای هر خوشه برچسبی خاص آن خوشه تعلق میگیرد، سپس دادهی ورودی به همراه برچسبهای جدید خود به عنوان ورودی به یک شبکهی عصبی عمیق پیچشی داده میشود. این روش در کنار استفاده از دادهافزایی در جهت افزایش نمونههای آموزشی، توانست عملکرد بسیار خوبی از خود نشان دهد و بر روی مجموعهی دادگانesc-10 به دقت میانگین 1/91 درصد بر روی دستههای مختلف دست یابد.
|
کلیدواژه
|
صدای محیط ,esc-10 ، cnn ,k-means ,خوشهبندی ,شبکه عصبی پیچشی
|
آدرس
|
دانشگاه شهید بهشتی, ایران, دانشگاه شهید بهشتی, ایران, دانشگاه شهید بهشتی, ایران
|
|
|
|
|
|
|