|
|
کاهش فضای جستجو در بازشناسی زیر کلمات تایپی فارسی با استفاده از ویژگیهای زیستسنجه مینوشیا
|
|
|
|
|
نویسنده
|
تیمورپور امین ,تقیپور گرجیکلایی مهران ,رضوی محمّد
|
منبع
|
مهندسي برق و الكترونيك ايران - 1401 - دوره : 19 - شماره : 2 - صفحه:187 -197
|
چکیده
|
با توجه به گسترده بودن زیرکلمات تایپ شده فارسی، یافتن یک زیرکلمه و به تبع آن یک کلمه در یک متن چاپ شده کار بسیار زمانبری خواهد بود. در این مقاله روشی مبتنی بر نقاط زیستسنجه مینوشیا ارائه شده است که فضای جستجوی زیرکلمات تایپ شده فارسی را به صورت قابل توجهی کاهش میدهد. لذا تعداد نقاط و مختصات مینوشیای انشعابی و انتهایی که دو ویژگی مطرح در حوزه زیستسنجه میباشند، بعنوان ویژگیهایی برای کاهش فضای جستجو در قالب یک روش دومرحلهای استفاده شدهاند. در گام نخست نقاط مینوشیا از تصویر زیرکلمه استخراج شده و در چهارخوشه که از لحاظ تعداد نقاط به یکدیگر نزدیک هستند دستهبندی میشوند، به این ترتیب فضای جستجو تقریباً نصف خواهد شد. در گام دوم با ایجاد یک مخزن از فواصل اولین تا آخرین نقطه انتهایی برای هر زیرکلمه در هر خوشه و تطبیق فاصله مذکور در تصویر آزمایشی با مخزن، فضای جستجو به مقدار قابل توجهی کاهش مییابد. نتایج بدست آمده از اعمال روش پیشنهادی بر روی تصاویر زیرکلمه موجود در پایگاه داده نشان میدهد، فضای جستجو از 12700 زیرکلمه به حدود 500 زیرکلمه با دقت تقریبی 90 درصد کاهش یافته است.
|
کلیدواژه
|
زیرکلمات فارسی، زیستسنجه، فضای جستجو، ویژگی مینوشیا
|
آدرس
|
دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
smrazavi@birjand.ac.ir
|
|
|
|
|
|
|
|
|
Search Space Reduction in Farsi Machine-printed Sub-words Recognition by using Biometric Minutia Features
|
|
|
Authors
|
Teymourpour Amin ,Taghipour-Gorjikolaie Mehran ,Razavi Seyyed Mohammad
|
Abstract
|
Due to the wide range of Persian (Farsi) machineprinted subwords, finding a subword and consequently a word in a machineprinted text will be very time consuming. In this paper, a biometric minutia based method is presented, which significantly reduces the search space of Farsi subwords. Therefore, the number of points and their coordinates of bifurcated and ending minutia points, which are two wellknown features in the field of biometrics, have been used as features to reduce the search space in the form of a twostep method. In the first step, the minutia points are extracted from the subword image and categorized into four clusters that are close and similar as a viewpoint of the number of minutia points. Therefore, search space will be halved by this step. In the second step, by creating a repository of the distances between the first and the last end points for each subword in each cluster and matching the same distance of experimental image with the repository, the search space is significantly reduced. Obtained results show that the search space has been reduced from 12,700 subwords to about 500 subkeywords with an accuracy of approximately 90%.
|
Keywords
|
Farsi sub-word ,Biometric ,Search space ,Minutia feature
|
|
|
|
|
|
|
|
|
|
|