|
|
بازشناسی شورایی زیرکلمه تایپی فارسی در فضای محدود شده با روش ترکیب رایگیری وزندار هوشمند
|
|
|
|
|
نویسنده
|
میری علی ,رضوی محمد ,میری اسماعیل
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1400 - دوره : 10 - شماره : 3 - صفحه:60 -72
|
چکیده
|
در این مقاله روشی شورایی برای بازشناسی زیرکلمات تایپی فارسی ارائه میشود. ابتدا فضای جستجو با استفاده از چند ویژگی ساده به تعداد خیلی کم از زیرکلمات محدود میشود. سپس با ترکیب شش طبقهبند پایه با روش رای گیری وزندار زیرکلمه بازشناسی میشود. یک طبقهبند پایه همان محدود کننده فضای جستجو است. چهار طبقهبند پایه از روش نزدیکترین همسایگی و به ترتیب با ویژگیهای مکان مشخصه، ناحیهبندی، تعداد تقاطع عمودی متن و زمینه و dct استفاده میکنند. در یک طبقهبند دیگر با استفاده از حاصل ضرب تصاویر نرمالیزه زیرکلمه ورودی و زیرکلمات محدود شده آموزشی یک میزان شباهت برای هر زیرکلمه آموزشی بدست میآید و با آن بازشناسی را انجام میدهد. سپس زیرکلمه نهایی در یک فرایند رای گیری وزندار که وزنهای بهینه آن توسط الگوریتم هوشمند بدست میآیند از بین این گزینهها انتخاب میگردد. این روش برای قلم لوتوس آزمایش شده و نرخ بازشناسی 98.34% برای دادههای آزمون بدست آمده است.
|
کلیدواژه
|
بازشناسی، تایپی، شورایی، زیرکلمات، رای گیری، فارسی
|
آدرس
|
دانشگاه صنعتی شریف, دانشکده مهندسی صنایع, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
miri.esmail@birjand.ac.ir
|
|
|
|
|
|
|
|
|
Ensemble Recognition of Persian Typed Sub-word in limited Space Using Smart weighted voting
|
|
|
Authors
|
miri ali ,Razavi Dr. Seyyed Mohammad ,miri ismail
|
Abstract
|
In this paper, an ensemble method for recognition of Persian typed subwords is proposed. First, the search space is limited to a very small number of subwords using a few simple features. Then, by combining the six basic classifications with the weighted voting method, the subword is recognized. One of basic classifiers is the same as the search space limiter. Four of the basic classifiers use the nearest neighbor method with each feature of the loci, zoning, the number of the vertical cross between text and background and DCT, respectively. In another classifier, using the product of the normalized image of the input subword and the images of the reduced training subwords, A degree of similarity is obtained for each training subwords And with its help, the subword is recognized. The final subword is selected from the options obtained in a weighted voting process whose optimal weights are obtained by an intelligent algorithm. This method has been tested for lotus font and 98.34% recognition rate has been gained for this data.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|