بازشناسی برخط حروف مجزای دستنویس فارسی براساس تشخیص گروه بدنه اصلی با استفاده از ماشین بُردار پشتیبان
|
|
|
|
|
نویسنده
|
مهرعلیان محمدامین ,فولادی کاظم
|
منبع
|
پردازش علائم و داده ها - 1391 - دوره : 9 - شماره : 17 - صفحه:59 -66
|
|
|
چکیده
|
در این مقاله روشی جدید برای بازشناسی برخط حروف مجزای فارسی ارایه شده است که با استخراج چند ویژگی ساده از دنباله نمونهبرداری شده از حروف و استفاده از دستهبندی کننده ماشین بردار پشتیبان( svm) نتایج قابل قبولی را اریه میدهد. الگوریتم پیشپردازش استفاده شده در این کار امکان یکسان سازی ابعاد ویژگیها به ازای حروف متعدد را فراهم میکند تا در مرحله بعدی به منظور بازشناسی به دستهبندی کننده ارسال شود. فرآیند بازشناسی در دو مرحله صورت میگیرد: در مرحله اوّل بدنه اصلی حرف ورودی (اوّلین حرکت قلم) پس از استخراج ویژگی با استفاده از دستهبندی کننده در قالب یکی از هجده گروه بدنه اصلی حروف، طبقهبندی میشود و سپس در مرحله دوم، موقعیت، تعداد و شکل سایر حرکتها مانند نقطه و سرکش (ریزحرکتها)، نوع حرف نهایی را تعیین میکند. به عنوان نمونه برای تشخیص حرف «ت» ابتدا گروه بدنه «ب، پ، ت، ث» تشخیص داده میشود و سپس وجود ریزحرکت «دونقطه» در بالای آن منجر به انتخاب «ت» از این گروه میشود. درنهایت در فرآیند پسپردازش با استفاده از تطبیق اطّلاعات مربوط به بدنه اصلی و ریزحرکات سامانه به تصحیح خطاهای احتمالی موجود در مراحل قبلی پرداخته و دقّت بازشناسی را افزایش میدهد به عنوان مثال اگر در مرحله دستهبندی بدنه حرف «ل» تشخیص داده شود ولی یک نقطه در بالای آن قرار داشته باشد آنگاه سامانه تشخیص خود را به حرف «ن» تغییر خواهد داد. نتایج تجربی این کار پژوهشی که بر اساس مجموعه داده online-tmu صورت گرفته است، متوسط نرخ بازشناسی بدنه اصلی را 94% نشان میدهد و با درنظرگرفتن پسپردازشها بر اساس ریزحرکتها این نرخ به حدود 98% میرسد.
|
کلیدواژه
|
بازشناسی برخط حروف فارسی ,بازشناسی دستنوشته/ دستنویس ,ریزحرکت ,ماشین بردار پشتیبان (Svm)
|
آدرس
|
|
|
|
|
|
|
|