مقایسه روشهای مختلف یادگیری ماشین در خلاصهسازی استخراجی گفتار به گفتار فارسی بدون استفاده از رونوشت
|
|
|
|
|
نویسنده
|
جعفری هدی سادات ,همایون پور محمدمهدی
|
منبع
|
پردازش علائم و داده ها - 1396 - دوره : 14 - شماره : 4 - صفحه:143 -157
|
|
|
چکیده
|
در این مقاله، خلاصه سازی استخراجی گفتار با استفاده از روش های مختلف یادگیری ماشین مورد مطالعه قرار گرفته است. خلاصه سازی یک فایل گفتاری به معنای استخراج بخش های مهم و شاخص گفتار به منظور دسترسی، جستجو، استخراج و مرورگری آسان تر و کم هزینه تر اطلاعات فایل های گفتاری است. در این مقاله، یک روش جدید خلاصه سازی گفتار بدون استفاده از سامانه بازشناسی خودکار گفتار ارائه شده است. الگوهای تکراری بین دو جمله گفتاری با استفاده از الگوریتم sdtw، به طورمستقیم از روی سیگنال گفتار شناسایی می شوند. بعد از تعیین شباهت بین دو جمله و استخراج تعدادی ویژگی از هر جمله تاثیر روش های مختلف یادگیری ماشین، بانظارت، بی نظارت و نیمه نظارتی مورد بررسی قرار گرفته است. آزمایش ها برروی یک پیکره خوانده شده اخبار فارسی انجام شده است. نتایج نشان می دهد با استفاده از ویژگی های مناسب، بدون استفاده از رونوشت به کارایی بالاتری نسبت به روش های پایه (3٪ افزایش در مقایسه با انتخاب نخستین جملات و 5٪ افزایش در مفایسه با انتخاب طولانی ترین جملات با استفاده از معیار rouge3) می توان دست پیدا کرد.
|
کلیدواژه
|
خلاصهسازی استخراجی گفتار، سیگنال گفتار، الگوها کلیدی، الگوریتم S-Dtw، یادگیری ماشین
|
آدرس
|
دانشگاه صنعتی امیرکبیر, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, آزمایشگاه پردازش هوشمند داده های چند رسانه ای, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, آزمایشگاه پردازش هوشمند داده های چند رسانه ای, ایران
|
|
|
|
|
|
|