>
Fa   |   Ar   |   En
   بازشناسی شورایی زیرکلمه تایپی فارسی در فضای محدود شده با روش ترکیب رای‌گیری وزن‌دار هوشمند  
   
نویسنده میری علی ,رضوی محمد ,میری اسماعیل
منبع رايانش نرم و فناوري اطلاعات - 1400 - دوره : 10 - شماره : 3 - صفحه:60 -72
چکیده    در این مقاله روشی شورایی برای بازشناسی زیرکلمات تایپی فارسی ارائه می‌شود. ابتدا فضای جستجو با استفاده از چند ویژگی ساده به تعداد خیلی کم از زیرکلمات محدود می‌شود. سپس با ترکیب شش طبقه‌بند پایه با روش رای گیری وزن‌دار زیرکلمه بازشناسی می‌شود. یک طبقه‌بند پایه همان محدود کننده فضای جستجو است. چهار طبقه‌بند پایه از روش نزدیکترین همسایگی و به ترتیب با ویژگی‌های مکان مشخصه، ناحیه‌بندی، تعداد تقاطع عمودی متن و زمینه و dct استفاده می‌کنند. در یک طبقه‌بند دیگر با استفاده از حاصل ضرب تصاویر نرمالیزه زیرکلمه ورودی و زیرکلمات محدود شده آموزشی یک میزان شباهت برای هر زیرکلمه آموزشی بدست می‌آید و با آن بازشناسی را انجام می‌دهد. سپس زیرکلمه نهایی در یک فرایند رای گیری وزن‌دار که وزن‌های بهینه آن توسط الگوریتم هوشمند بدست می‌آیند از بین این گزینه‌ها انتخاب می‌گردد. این روش برای قلم لوتوس آزمایش شده و نرخ بازشناسی 98.34% برای داده‌های آزمون بدست آمده است.
کلیدواژه بازشناسی، تایپی، شورایی، زیرکلمات، رای گیری، فارسی
آدرس دانشگاه صنعتی شریف, دانشکده مهندسی صنایع, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی miri.esmail@birjand.ac.ir
 
   Ensemble Recognition of Persian Typed Sub-word in limited Space Using Smart weighted voting  
   
Authors miri ali ,Razavi Dr. Seyyed Mohammad ,miri ismail
Abstract    In this paper, an ensemble method for recognition of Persian typed subwords is proposed. First, the search space is limited to a very small number of subwords using a few simple features. Then, by combining the six basic classifications with the weighted voting method, the subword is recognized. One of basic classifiers is the same as the search space limiter. Four of the basic classifiers use the nearest neighbor method with each feature of the loci, zoning, the number of the vertical cross between text and background and DCT, respectively. In another classifier, using the product of the normalized image of the input subword and the images of the reduced training subwords, A degree of similarity is obtained for each training subwords And with its help, the subword is recognized. The final subword is selected from the options obtained in a weighted voting process whose optimal weights are obtained by an intelligent algorithm. This method has been tested for lotus font and 98.34% recognition rate has been gained for this data.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved