>
Fa   |   Ar   |   En
   مقایسه روش‌های مختلف یادگیری ماشین در خلاصه‌سازی استخراجی گفتار به گفتار فارسی بدون استفاده از رونوشت  
   
نویسنده جعفری هدی سادات ,همایون پور محمدمهدی
منبع پردازش علائم و داده ها - 1396 - دوره : 14 - شماره : 4 - صفحه:143 -157
چکیده    در این مقاله، خلاصه سازی استخراجی گفتار با استفاده از روش های مختلف یادگیری ماشین مورد مطالعه قرار گرفته است. خلاصه سازی یک فایل گفتاری به معنای استخراج بخش های مهم و شاخص گفتار به منظور دسترسی، جستجو، استخراج و مرورگری آسان تر و کم هزینه تر اطلاعات فایل های گفتاری است. در این مقاله، یک روش جدید خلاصه سازی گفتار بدون استفاده از سامانه بازشناسی خودکار گفتار ارائه شده است. الگوهای تکراری بین دو جمله گفتاری با استفاده از الگوریتم sdtw، به طورمستقیم از روی سیگنال گفتار شناسایی می شوند. بعد از تعیین شباهت بین دو جمله و استخراج تعدادی ویژگی از هر جمله تاثیر روش های مختلف یادگیری ماشین، بانظارت، بی نظارت و نیمه نظارتی مورد بررسی قرار گرفته است. آزمایش ها برروی یک پیکره خوانده شده اخبار فارسی انجام شده است. نتایج نشان می دهد با استفاده از ویژگی های مناسب، بدون استفاده از رونوشت به کارایی بالاتری نسبت به روش های پایه (3٪ افزایش در مقایسه با انتخاب نخستین جملات و 5٪ افزایش در مفایسه با انتخاب طولانی ترین جملات با استفاده از معیار rouge3) می توان دست پیدا کرد.
کلیدواژه خلاصه‌سازی استخراجی گفتار، سیگنال گفتار، الگوها کلیدی، الگوریتم S-Dtw، یادگیری ماشین
آدرس دانشگاه صنعتی امیرکبیر, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, آزمایشگاه پردازش هوشمند داده های چند رسانه ای, ایران, دانشگاه صنعتی امیرکبیر, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, آزمایشگاه پردازش هوشمند داده های چند رسانه ای, ایران
 
   A comparison of machine learning techniques for Persian Extractive Speech to Speech Summarization without Transcript  
   
Authors Jafari Hoda Sadat ,homayounpour mohammadmehdi
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved