|
|
ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار
|
|
|
|
|
نویسنده
|
دیانت روح الله ,احمدی مرتضی علی ,اخلاقی محمد یحیی ,باباعلی باقر
|
منبع
|
پردازش علائم و داده ها - 1395 - دوره : 13 - شماره : 4 - صفحه:93 -108
|
چکیده
|
در این مقاله، یک پیش پردازش روی روش های بازیابی اطلاعات، ارائه می شود که برای بازیابی اطلاعات حاصل از متون بازشناسی شده ی گفتاری، مناسب است. این پیش پردازش، به شکل ترکیبی از اصلاح و گسترش پرس و جو می باشد. ورودی های مسئله، اسناد متنی بدست آمده از بازشناسی گفتار و پرس و جو می باشد و هدف، یافتن اسناد مرتبط با کلمه پرس و جو است. مشکل آن است که متن حاصل از بازشناسی گفتار، همواره دارای درصد خطایی در بازشناسی است که ممکن است منجر به این شود که کلماتی که در واقع مرتبط هستند و به علت وقوع خطای بازشناسی دگرگون شده اند مرتبط تشخیص داده نشوند. ایده ی روش ارائه شده، تشخیص خطای بازشناسی در کلمات و در نظر گرفتن کلمات مشابه برای آن دسته از کلماتی است که به عنوان خطا تشخیص داده شده اند. برای تشخیص کلمه ی خطا، پارامتری به عنوان احتمال خطا در کلمه تعریف می شود که بزرگ بودن آن بیانگر امکان بیشتر وقوع خطا در کلمه است. همچنین برای تشخیص کلمات مشابه، ابتدا با استفاده از معیار فاصله لونشتاین، کلمات مشابه اولیه را پیدا می کنیم. سپس احتمال تبدیل این کلمات مشابه به کلمه پرس و جوی اصلی، محاسبه می شود. کلمات مشابه معنایی، از بین کلماتی که احتمال تبدیل بیشتری دارند، بر اساس یک سطح آستانه انتخاب می شوند. اکنون در الگوریتم بازیابی، علاوه بر کلمه اصلی، کلمات مشابه آن نیز در جستجو، مرتبط در نظر گرفته می شوند. نتایج پیاده سازی ها نشان می دهد که الگوریتم ارائه شده، معیار f را به میزان حداکثر 30 % بهبود می بخشد.
|
کلیدواژه
|
بازیابی اطلاعات- بازشناسی گفتار- سند- پرس و جو- فاصله لونشتاین
|
آدرس
|
دانشگاه قم, دانشکده فنی و مهندسی, گروه مهندسی فناوری اطلاعات, ایران, دانشگاه قم, دانشکده فنی و مهندسی, گروه مهندسی فناوری اطلاعات, ایران, دانشگاه خاتم النبیین, گروه علوم کامپیوتر , افغانستان, دانشگاه تهران, دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم, ایران
|
پست الکترونیکی
|
babaali@ut.ac.ir
|
|
|
|
|
|
|
|
|
Introducing a new information retrieval method applicable for speech recognized texts
|
|
|
Authors
|
dianat rouhollah ,ahmadi morteza ali ,akhlaghi yahya ,babaali bagher
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|