>
Fa   |   Ar   |   En
   ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی بریده شده با استفاده از تعبیه برچسب  
   
نویسنده ایرانپور مبارکه مجید ,احمدی فرد علیرضا
منبع ماشين بينايي و پردازش تصوير - 1395 - دوره : 3 - شماره : 1 - صفحه:45 -54
چکیده    جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (ocr) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده بندی مبتنی بر خصیصه (attributebased classification) و همچنین تعبیه برچسب (label embedding) است. در این مقاله چند خصیصه مختلف مبتنی بر ساختار نگارش زبان فارسی جهت استفاده در بازیابی کلمات تصویری فارسی معرفی شده و نتایج حاصل از روش های مبتنی بر خصیصه های پیشنهادی مقایسه گردیده است. در ارائه خصیصه ها ساختار نگارشی زبان فارسی درنظر گرفته شده است تا بهترین مطابقت را با روش نگارش فارسی داشته باشد. روش مورد مطالعه توانایی بازیابی کلمات تصویری با استفاده از کلمه پرسشی تصویری و متنی را داراست. علاوه بر این می تواند به عنوان روشی جهت بازشناسی کلمات نیز مورد استفاده قرار گیرد. همچنین روش ارائه شده با استفاده از قابلیت رده بندی مبتنی بر خصیصه، توانایی شناسایی کلاس کلماتی که در پایگاه داده آموزشی وجود ندارد را نیز دارا است. آزمایش های تجربی بر روی دو مجموعه داده استاندارد فارسا و ایرانشهر مورد بررسی قرار گرفته و نتایج حاصل از اجرای روش پیشنهادی قابل قبول است.
کلیدواژه بازیابی کلمات تصویری دستنویس، بازشناسی کلمات تصویری دستنویس، رده‌بندی مبتنی بر خصیصه، تعبیه برچسب
آدرس دانشگاه صنعتی شاهرود, دانشکده مهندسی کامپیوتر و فناوری اطلاعات, ایران, دانشگاه صنعتی شاهرود, دانشکده مهندسی برق و رباتیک, ایران
پست الکترونیکی alireza.ahmadyfard@gmail.com
 
   Persian specific Attribute for Handwritten Image Word spotting and recognition by LabelEmbedding  
   
Authors Ahmadyfard Alireza ,Iranpour Mobarakeh Majid
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved