رفع اعوجاج هندسی متون بهکمک اطلاعات هندسی خطوط متن
|
|
|
|
|
نویسنده
|
طلوع بیدختی محمدامین ,احمدی فرد علیرضا
|
منبع
|
پردازش علائم و داده ها - 1396 - دوره : 14 - شماره : 2 - صفحه:141 -158
|
چکیده
|
تصاویر سند تهیه شده توسط پویش گر یا دوربین دیجیتال، همواره با اعوجاج های فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم افزارهای شناسایی نویسه ها (ocr) می شوند. در این مقاله روشی نوین جهت رفع اعوجاج های هندسی از تصاویر متنی ارائه شده است. در روش پیشنهادی به منظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج و سپس هر خط متن به ستون هایی به عرض مساوی شکسته می شوند. برای هر قطعه استخراج شده از یک خط، راستای قطعه به نحوی تصحیح می شود که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور به ازای چرخش های مختلف قطعۀ متن، افکنش افقی تصویر محاسبه می شود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیح شده آن قطعه در نظر گرفته می شود. بر این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعه خط هم راستا شده با افق استخراج می شود. به کمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن به کمک برازش یک تابع درجۀ سه به دست می آید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می شود. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگ تر مجاور آن خط استفاده شده است. روش پیشنهادی بر روی پایگاه های دادۀ فارسی و انگلیسی پیاده سازی و با برخی روش های هم تراز آن مقایسه شده است. نتایج بیان گر قدرت و دقّت روش پیشنهادی در رفع اعوجاج هندسی است.
|
کلیدواژه
|
اعوجاج هندسی، پردازش دوبعدی اسناد، تخمین تبدیل پرسپکتیو، نویسهخوان نوری
|
آدرس
|
دانشگاه صنعتی شاهرود, دانشکده مهندسی برق, گروه الکترونیک, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی برق, گروه الکترونیک, ایران
|
پست الکترونیکی
|
ahmadyfard@shahroodut.ac.ir
|
|
|
|
|