|
|
تشخیص موضوع از روی گفتار مبتنی بر شبکه عصبی کوتاه مدت ماندگار
|
|
|
DOR
|
20.1001.2.9920027388.1399.17.1.10.8
|
نویسنده
|
عسگری محمد ,اکبری نرگس ,محرابیکیا محمدصادق ,حجتی فاطمه
|
منبع
|
اجلاس فناوري رسانه - 1399 - دوره : 17 - هفدهمین اجلاس فناوری رسانه - کد همایش: 99200-27388
|
چکیده
|
جستجو در منابع صوتی و تصویری برای دسترسی به موضوعی خاص (و یا دستهبندی پیامهای صوتی مرتبط و یا حذف پیامهای صوتی نامناسب)، توسط نیروی انسانی، فرایندی زمانبر، هزینهبر و خستهکننده است (حتی ممکن است بهدلیل حجم زیاد اطلاعات، دقت کافی وجود نداشته باشد). هدف از این تحقیق ارائهی یک سیستم دو مرحلهایِ یکپارچهی تشخیص موضوع از روی سیگنال گفتار است. در مرحلهی اول از ابزار کلدی و دادگان فارسدات بزرگ برای بازشناسی گفتار و تبدیل آن به متن استفاده شده است. نرخ خطای کلمه برروی دادگان آزمایش از فارسدات بزرگ 2 درصد و برروی دادگان آزمایش از روی دادگان جمعآوری شده از برنامههای اجتماعی رادیو و تلویزیون در حدود 25 درصد بهدست آمده است. در مرحلهی دوم از روی متن بهدست آمده، پس از پیشپردازشها، کلیدواژهها با استفاده از شبکه عصبی کوتاه مدت ماندگار تشخیص داده شده و در نهایت با استفاده از روش دیکشنری موضوع اجتماعی با دقت 56.17 درصد استخراج شده است.
|
کلیدواژه
|
تشخیص موضوع ,تشخیص کلیدواژه ,بازشناسی گفتار ,تبدیل گفتار به متن ,شبکه عصبی عمیق
|
آدرس
|
دانشگاه صدا و سیما, ایران, سازمان صدا و سیمای جمهوری اسلامی ایران, معاونت توسعه و فناوری رسانه, ایران, سازمان صدا و سیمای جمهوری اسلامی ایران, معاونت توسعه و فناوری رسانه, ایران, سازمان صدا و سیمای جمهوری اسلامی ایران, معاونت توسعه و فناوری رسانه, ایران
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|