>
Fa   |   Ar   |   En
   رفع اعوجاج هندسی متون به‌کمک اطلاعات هندسی خطوط متن  
   
نویسنده طلوع بیدختی محمدامین ,احمدی فرد علیرضا
منبع پردازش علائم و داده ها - 1396 - دوره : 14 - شماره : 2 - صفحه:141 -158
چکیده    تصاویر سند تهیه شده توسط پویش گر یا دوربین دیجیتال، همواره با اعوجاج های فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم افزارهای شناسایی نویسه ها (ocr) می شوند. در این مقاله روشی نوین جهت رفع اعوجاج های هندسی از تصاویر متنی ارائه شده است. در روش پیشنهادی به منظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج و سپس هر خط متن به ستون هایی به عرض مساوی شکسته می شوند. برای هر قطعه استخراج شده از یک خط، راستای قطعه به نحوی تصحیح می شود که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور به ازای چرخش های مختلف قطعۀ متن، افکنش افقی تصویر محاسبه می شود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیح شده آن قطعه در نظر گرفته می شود. بر این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعه خط هم راستا شده با افق استخراج می شود. به کمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن به کمک برازش یک تابع درجۀ سه به دست می آید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می شود. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگ تر مجاور آن خط استفاده شده است. روش پیشنهادی بر روی پایگاه های دادۀ فارسی و انگلیسی پیاده سازی و با برخی روش های هم تراز آن مقایسه شده است. نتایج بیان گر قدرت و دقّت روش پیشنهادی در رفع اعوجاج هندسی است.
کلیدواژه اعوجاج هندسی، پردازش دوبعدی اسناد، تخمین تبدیل پرسپکتیو، نویسه‌خوان نوری
آدرس دانشگاه صنعتی شاهرود, دانشکده مهندسی برق, گروه الکترونیک, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی برق, گروه الکترونیک, ایران
پست الکترونیکی ahmadyfard@shahroodut.ac.ir
 
   Document Image Dewarping using geometrical information extracted from document lines  
   
Authors Tolou Beidokhti Mohammad Amin ,Ahmadyfard Alireza
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved