بازشناسی کلمات دست‌نویس فارسی بر‌اساس ویژگی کد زنجیره‌ای فریمن دنباله مرکز جرم و طبقه‌بند بهبود یافته

Fa | Ar | En

بازشناسی کلمات دست‌نویس فارسی بر‌اساس ویژگی کد زنجیره‌ای فریمن دنباله مرکز جرم و طبقه‌بند بهبود یافته


نویسنده	خسروی سارا ,چاله چاله عبداله
منبع	رايانش نرم و فناوري اطلاعات - 1397 - دوره : 7 - شماره : 2 - صفحه:43 -57
چکیده	در این مقاله روش جدیدی برای بازشناسی برون‌خط کلمات فارسی دست‌نویس ارائه شده است. روش پیشنهادی شامل معرفی ویژگی جدید و قدرتمند کد زنجیره‌ای فریمن دنباله مرکز جرم (csfcc)، در کنار استفاده از ویژگی‌های ریخت‌شناسی و همچنین استفاده از طبقه‌بند ماشین بردار پشتیبان (svm) بهبود یافته می‌باشد. در روش پیشنهادی، طبقه‌بند ماشین بردار پشتیبان(svm)، با استفاده از ترکیب دو الگوریتم بهینه‌سازی ازدحام ذرات (pso) و الگوریتم جستجوی گرانشی (gsa)، که به‌اختصار آن را psogsa می‌نامیم؛ بهبود یافته است. رویکرد به کار برده شده در این تحقیق، تشخیص تمامی اجزای متصل به هم در کلمه و سپس ترکیب آن‌ها با یکدیگر می‌باشد. به همین منظور، یک فرهنگ لغت تصویری از زیرکلمات بدون علامت تهیه شده است. علاوه بر این، به‌منظور کاهش فضای جستجو، افزایش سرعت و دقت بازشناسی، یک پایگاه داده از موقعیت زیرکلمات بدون علامت اصلی نیز ایجاد و مورد استفاده قرار گرفته است. این کار باعث شد؛ تا برای بازشناسی یک زیرکلمه، بر‌اساس موقعیت آن در کلمه اصلی تصمیم‌گیری و احتمال تشخیص درست افزایش یابد. روش پیشنهادی بر روی پایگاه داده شناخته شده‌ی ایرانشهر که شامل حدود 17000 تصویر از اسامی دست‌نویس 503 شهر ایران است؛ اجرا شده است. دقت بازشناسی به دست آمده در روش پیشنهادی، 89% در بخش آزمایش می‌باشد؛ که نشان‌دهنده توانمندی روش پیشنهادی و بهبود نتایج در مقایسه با دیگر روش‌های موجود است.
کلیدواژه	بازشناسی برون‌خط کلمات فارسی دست‌نویس، کد زنجیره‌ای فریمن دنباله مرکز جرم (csfcc)، ویژگی‌های ریخت‌شناسی، ماشین بردار پشتیبان (svm)، الگوریتم بهینه‌سازی psogsa
آدرس	دانشگاه رازی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه رازی, دانشکده مهندسی کامپیوتر, ایران
پست الکترونیکی	chalechale@razi.ac.ir



Authors