>
Fa   |   Ar   |   En
   کاهش فضای جستجو در بازشناسی زیر کلمات تایپی فارسی با استفاده از ویژگی‌های زیست‌سنجه مینوشیا  
   
نویسنده تیمورپور امین ,تقی‌پور گرجی‌کلایی مهران ,رضوی محمّد
منبع مهندسي برق و الكترونيك ايران - 1401 - دوره : 19 - شماره : 2 - صفحه:187 -197
چکیده    با توجه به گسترده بودن زیرکلمات تایپ شده فارسی، یافتن یک زیرکلمه و به تبع آن یک کلمه در یک متن چاپ شده کار بسیار زمانبری خواهد بود. در این مقاله روشی مبتنی بر نقاط زیست‌سنجه مینوشیا ارائه شده است که فضای جستجوی زیرکلمات تایپ شده فارسی را به صورت قابل توجهی کاهش می‌دهد. لذا تعداد نقاط و مختصات مینوشیای انشعابی و انتهایی که دو ویژگی مطرح در حوزه زیست‌سنجه می‌باشند، بعنوان ویژگی‌هایی برای کاهش فضای جستجو در قالب یک روش دومرحله‌ای استفاده شده‌اند. در گام نخست نقاط مینوشیا از تصویر زیرکلمه استخراج شده و در چهارخوشه که از لحاظ تعداد نقاط به یکدیگر نزدیک هستند دسته‌بندی می‌شوند، به این ترتیب فضای جستجو تقریباً نصف خواهد شد. در گام دوم با ایجاد یک مخزن از فواصل اولین تا آخرین نقطه انتهایی برای هر زیرکلمه در هر خوشه و تطبیق فاصله مذکور در تصویر آزمایشی با مخزن، فضای جستجو به مقدار قابل توجهی کاهش می‌یابد. نتایج بدست آمده از اعمال روش پیشنهادی بر روی تصاویر زیرکلمه موجود در پایگاه داده نشان می‌دهد، فضای جستجو از 12700 زیرکلمه به حدود 500 زیرکلمه با دقت تقریبی 90 درصد کاهش یافته است.
کلیدواژه زیرکلمات فارسی، زیست‌سنجه، فضای جستجو، ویژگی مینوشیا
آدرس دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی smrazavi@birjand.ac.ir
 
   Search Space Reduction in Farsi Machine-printed Sub-words Recognition by using Biometric Minutia Features  
   
Authors Teymourpour Amin ,Taghipour-Gorjikolaie Mehran ,Razavi Seyyed Mohammad
Abstract    Due to the wide range of Persian (Farsi) machineprinted subwords, finding a subword and consequently a word in a machineprinted text will be very time consuming. In this paper, a biometric minutia based method is presented, which significantly reduces the search space of Farsi subwords. Therefore, the number of points and their coordinates of bifurcated and ending minutia points, which are two wellknown features in the field of biometrics, have been used as features to reduce the search space in the form of a twostep method. In the first step, the minutia points are extracted from the subword image and categorized into four clusters that are close and similar as a viewpoint of the number of minutia points. Therefore, search space will be halved by this step. In the second step, by creating a repository of the distances between the first and the last end points for each subword in each cluster and matching the same distance of experimental image with the repository, the search space is significantly reduced. Obtained results show that the search space has been reduced from 12,700 subwords to about 500 subkeywords with an accuracy of approximately 90%.
Keywords Farsi sub-word ,Biometric ,Search space ,Minutia feature
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved