بازشناسی کلمات دستنویس فارسی براساس ویژگی کد زنجیرهای فریمن دنباله مرکز جرم و طبقهبند بهبود یافته
|
|
|
|
|
نویسنده
|
خسروی سارا ,چاله چاله عبداله
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1397 - دوره : 7 - شماره : 2 - صفحه:43 -57
|
چکیده
|
در این مقاله روش جدیدی برای بازشناسی برونخط کلمات فارسی دستنویس ارائه شده است. روش پیشنهادی شامل معرفی ویژگی جدید و قدرتمند کد زنجیرهای فریمن دنباله مرکز جرم (csfcc)، در کنار استفاده از ویژگیهای ریختشناسی و همچنین استفاده از طبقهبند ماشین بردار پشتیبان (svm) بهبود یافته میباشد. در روش پیشنهادی، طبقهبند ماشین بردار پشتیبان(svm)، با استفاده از ترکیب دو الگوریتم بهینهسازی ازدحام ذرات (pso) و الگوریتم جستجوی گرانشی (gsa)، که بهاختصار آن را psogsa مینامیم؛ بهبود یافته است. رویکرد به کار برده شده در این تحقیق، تشخیص تمامی اجزای متصل به هم در کلمه و سپس ترکیب آنها با یکدیگر میباشد. به همین منظور، یک فرهنگ لغت تصویری از زیرکلمات بدون علامت تهیه شده است. علاوه بر این، بهمنظور کاهش فضای جستجو، افزایش سرعت و دقت بازشناسی، یک پایگاه داده از موقعیت زیرکلمات بدون علامت اصلی نیز ایجاد و مورد استفاده قرار گرفته است. این کار باعث شد؛ تا برای بازشناسی یک زیرکلمه، براساس موقعیت آن در کلمه اصلی تصمیمگیری و احتمال تشخیص درست افزایش یابد. روش پیشنهادی بر روی پایگاه داده شناخته شدهی ایرانشهر که شامل حدود 17000 تصویر از اسامی دستنویس 503 شهر ایران است؛ اجرا شده است. دقت بازشناسی به دست آمده در روش پیشنهادی، 89% در بخش آزمایش میباشد؛ که نشاندهنده توانمندی روش پیشنهادی و بهبود نتایج در مقایسه با دیگر روشهای موجود است.
|
کلیدواژه
|
بازشناسی برونخط کلمات فارسی دستنویس، کد زنجیرهای فریمن دنباله مرکز جرم (csfcc)، ویژگیهای ریختشناسی، ماشین بردار پشتیبان (svm)، الگوریتم بهینهسازی psogsa
|
آدرس
|
دانشگاه رازی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه رازی, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
chalechale@razi.ac.ir
|
|
|
|
|