>
Fa
  |  
Ar
  |  
En
شناسایی و بازشناسی متن از تصاویر در جهات مختلف با استفاده از چارچوب خط لوله جدید
نویسنده
نعیمی فاطمه
منبع
دومين كنفرانس ملي كسب و كار نوين در مهندسي برق و كامپيوتر - 1402 - دوره : 2 - دومین کنفرانس ملی کسب و کار نوین در مهندسی برق و کامپیوتر - کد همایش: 02231-86821 - صفحه:0 -0
چکیده
شناسایی و تشخیص خودکار متن (تشخیص یکپارچه متن ) از تصاویر در زندگی واقعی، یک عنصر اصلی در مجموعه متنوعی از برنامههای سیستم هوشمند از جمله سیستمهای دستیار بینایی و اتومبیلرانی خودکار است. عناصر اصلی بسیاری از برنامه ها از جمله سیستم های کمکی و دید کم کور و اتومبیلهای خودران است. چکیده: اجرای pvanet به دلیل استفاده از لایه inception نتیجه بسیار خوبی را در بسیاری از برنامهها کسب کرده است. بااینحال، در روشهای تشخیص متن صحنه واقعی، pvanet معمولاً باید با دقت بیشتری طراحی شود تا استحکام محلی سازی متن را بهبود بخشد. در این مقاله از ساختار pvanet برای استخراج ویژگیهای دیداری سطح پایین استفاده میشود. همچنین از یک لایه اضافی برای بهبود استخراج ویژگی استفاده شده است. بلوک m.relu و لایه inception بهینهشدهاند تا حداکثر اطلاعات حیاتی را کشف کنند. مشاهده شده است که لایههای inception (کانولوشن 3* 3 یا کرنلهای بزرگتر) میتوانند متن متنوع با ابعاد مختلف را بهطور موثرتر از زنجیره خطی از لایههای کانولوشنی شناسایی نمایند. در این مقاله از دو پایگاه داده مشهور icdar 2017 و icdar 2003 جهت بررسی نتایج استفاده گردیده است. نتایج شناسایی متن در هر دو پایگاه داده نشان میدهد که رویکرد پیشنهادی، عملکرد قابل ملاحظهای در بهبود شناسایی متن به دست میآورد.
کلیدواژه
شناسایی و تشخیص خودکار متن ، متن صحنه واقعی، استخراج ویژگیهای دیداری
آدرس
, iran
پست الکترونیکی
daneshjo_naimi@yahoo.com
text detection and recognition from images in multi orientations using a new pipeline framework
Authors
Copyright 2023
Islamic World Science Citation Center
All Rights Reserved