ارایه یک رتبهبند برای خطایاب معنایی با استفاده از ویژگیهای حساس به متن
|
|
|
|
|
نویسنده
|
میرزابابایی بهزاد ,فیلی هشام
|
منبع
|
پردازش علائم و داده ها - 1394 - دوره : 12 - شماره : 3 - صفحه:3 -14
|
چکیده
|
در عصر فناوری، روزانه حجم زیادی از سند های الکترونیکی تولید می شود. ازآنجاکه این سند ها توسط افراد مختلف تولید می شود، دارای خطاهایی هستند. وجود خطاها باعث کاهش کیفیت سند ها می شود؛ بنابراین وجود ابزارهای خطایاب باعث افزایش کیفیت می شود. یکی از انواع خطاها، خطای معنایی حساس به متن است. همانطور که از نام آن برمی آید، برای تشخیص و تصحیح آن، نیاز به تحلیل اطلاعات موجود در متن است. در این مقاله، یک رتبه بند متمایزگر مستقل از زبان برای خطایاب های معنایی حساس به متن ارایه دادیم و از اطلاعات کل متن برای رتبه بندی استفاده کردیم. موجود بودن جمله های قبلی و بعدی جمله خطادار یکی از پیشنیازهای روش ارایه شده است. این رتبه بندی توسط ویژگی های حساس به متن و یک مدل لگاریتم خطی انجام شده است. برای ارزیابی روش، از دو روش مبنای مختلف که یکی بر اساس مترجم ماشینی آماری و دیگری بر اساس مدل زبانی است، استفاده کرده ایم. بهمنظور ارزیابی سامانه از دو داده آزمون مختلف در زبان فارسی استفاده شده است. این روش باعث بهبود 17% در بازخوانی تشخیص و تصحیح نسبت به روش مبنای مترجم ماشینی آماری شده است.
|
کلیدواژه
|
خطایاب ,خطای حساس به متن ,مترجم ماشینی آماری ,رتبه بندی آگاه به متن
|
آدرس
|
دانشگاه تهران, دانشکده مهندسی برق و کامپیوتر، پردیس دانشکده های فنی، دانشگاه تهران، تهران، ایران, ایران, دانشگاه تهران, دانشکده مهندسی برق و کامپیوتر، پردیس دانشکده های فنی، دانشگاه تهران، تهران، ایران, ایران
|
پست الکترونیکی
|
hfaili@ut.ac.ir
|
|
|
|
|