شناسایی و بازشناسی متن از تصاویر در جهات مختلف با استفاده از چارچوب خط لوله جدید

Fa | Ar | En

شناسایی و بازشناسی متن از تصاویر در جهات مختلف با استفاده از چارچوب خط لوله جدید


نویسنده	نعیمی فاطمه
منبع	دومين كنفرانس ملي كسب و كار نوين در مهندسي برق و كامپيوتر - 1402 - دوره : 2 - دومین کنفرانس ملی کسب و کار نوین در مهندسی برق و کامپیوتر - کد همایش: 02231-86821 - صفحه:0 -0
چکیده	شناسایی و تشخیص خودکار متن (تشخیص یکپارچه متن ) از تصاویر در زندگی واقعی، یک عنصر اصلی در مجموعه متنوعی از برنامه‌های سیستم هوشمند از جمله سیستم‌های دستیار بینایی و اتومبیل‌رانی خودکار است. عناصر اصلی بسیاری از برنامه ها از جمله سیستم های کمکی و دید کم کور و اتومبیلهای خودران است. چکیده: اجرای pvanet به دلیل استفاده از لایه inception نتیجه بسیار خوبی را در بسیاری از برنامه‌ها کسب کرده است. بااین‌حال، در روش‌های تشخیص متن صحنه واقعی، pvanet معمولاً باید با دقت بیشتری طراحی شود تا استحکام محلی سازی متن را بهبود بخشد. در این مقاله از ساختار pvanet برای استخراج ویژگی‌های دیداری سطح پایین استفاده می‌شود. همچنین از یک لایه اضافی برای بهبود استخراج ویژگی استفاده شده است. بلوک m.relu و لایه inception بهینه‌شده‌اند تا حداکثر اطلاعات حیاتی را کشف کنند. مشاهده شده است که لایه‌های inception (کانولوشن 3* 3 یا کرنل‌های بزرگ‌تر) می‌توانند متن متنوع با ابعاد مختلف را به‌طور موثرتر از زنجیره خطی از لایه‌های کانولوشنی شناسایی نمایند. در این مقاله از دو پایگاه داده مشهور icdar 2017 و icdar 2003 جهت بررسی نتایج استفاده گردیده است. نتایج شناسایی متن در هر دو پایگاه داده نشان می‌دهد که رویکرد پیشنهادی، عملکرد قابل ملاحظه‌ای در بهبود شناسایی متن به دست می‌آورد.
کلیدواژه	شناسایی و تشخیص خودکار متن ، متن صحنه واقعی، استخراج ویژگی‌های دیداری
آدرس	, iran
پست الکترونیکی	daneshjo_naimi@yahoo.com

text detection and recognition from images in multi orientations using a new pipeline framework

Authors