>
Fa   |   Ar   |   En
   استفاده از الگوریتم آنالیز اجزای اصلی جهت تشخیص نرم افزاری حروف در متون فارسی  
   
نویسنده گشمرد شهروز ,مهری دهنوی علیرضا ,ربانی حسین
منبع مجله دانشكده پزشكي اصفهان - 1390 - دوره : 29 - شماره : 174 - صفحه:3211 -3220
چکیده    مقدمه: ابداع روش منابع گویای خودکار، همواره یکی از دغدغه‌های فکری پژوهشگران بوده است تا ابزاری کارآمد جهت مطالعه‌ی متون معمولی توسط نابینایان تولید نمایند. در این راه، علاوه بر تلاش در جهت ساخت ابزارها، روش‌های بهینه جهت پردازش، شناخت و تفکیک نوشته‌ها و متون فارسی نیز مورد نیاز می‌باشد.روش‌ها: در این مقاله با استفاده از روش آنالیز اجزای اصلی، روشی جدید جهت تشخیص اتوماتیک حروف در تصاویر تهیه شده از حروف فارسی تایپ شده ارایه می‌گردد که قادر به بهبود روش‌های موجود از لحاظ دقت و سرعت می‌باشد. در این روش، که برگرفته از روش آنالیز اجزای اصلی می‌باشد، در اصل اجزای وابسته به تغییرات کم از داده‌ها حذف می‌شود و بدون از دست رفتن قسمت عمده‌ی اطلاعات تصویر، می‌توان شباهت‌ها و اختلافات بین تصاویر مختلف را با سرعت و دقت بیشتری مورد بررسی قرار داد.یافته‌ها: در این مقاله با انجام آزمایش‌های عملی متعدد، کارآیی بهتر روش اجزای اصلی در مقایسه‌ با روش‌های قبلی مانند روش‌های آماری و زرنیک سریع مورد تایید قرار گرفته است. برای مثال با آزمایش هر سه این روش‌ها بر یک مجموعه‌ی داده‌ی آموزشی یکسان و چهار مجموعه‌ی داده‌ی آزمونی یکسان، مشخص گردید که دقت این روش در مقایسه با روش آماری 1.775 درصد بهتر و سرعت آن 7.5 برابر شده است و در مقایسه با روش زرنیک سریع دقت 2.2 درصد بهبود داشته و سرعت آن نیز 5.12 برابر بیشتر شده است.نتیجه‌گیری: مقایسه‌ی نتایج نهایی اعمال داده‌ها به الگوریتم‌های مطرح شده در مقاله و مقایسه‌ی دقت و زمان آن‌ها نشان داد که الگوریتم آنالیز اجزای اصلی (pca) ترکیبی بهترین نتایج از لحاظ سرعت و دقت را به همراه دارد.
کلیدواژه الگوریتم ترکیبی و آنالیز اجزای اصلی، پردازش تصویر، شناسایی حروف فارسی
آدرس دانشگاه علوم پزشکی اصفهان, دانشکده ی پزشکی, گروه فیزیک و مهندسی پزشکی, ایران, دانشگاه علوم پزشکی اصفهان, دانشکده ی پزشکی, گروه فیزیک و مهندسی پزشکی, ایران, دانشگاه علوم پزشکی اصفهان, دانشکده ی پزشکی، مرکز تحقیقات پردازش تصویر و سیگنال پزشکی, گروه فیزیک و مهندسی پزشکی, ایران
 
   Using Principal Component Analysis to Recognize Farsi Alphabetic Characters in Printed Scripts  
   
Authors Gashmard Shahrouz ,Mehri Dehnavi Alireza ,Rabbani Hossein
Abstract    <p class=abstract><strong>Background:</strong> From the early stages of script writing and reading, there was a big desire for researchers to make an aid device for the blind to read scripts without help of other. This paper introduced a new approach for recognition of Farsi scripts using principal component analysis (PCA).</p><p class=abstract><strong>Methods: </strong>Materials used for this project were selected from ordinary books, magazines, newspapers, and printed documents. Character samples were selected from four fonts in different positions and three sizes resulted in total number of 20 recognition classes. The five methods used in character recognition were statistical method, Fast Zernike Wavelet Moments (FZWM) method, PCA, PCA with sample averaging, and PCA with eigenvectors averaging.</p><p class=abstract><strong>Findings: </strong>The accuracy and speed of PCA in recognition of Farsi characters were respectively 1.775% and 7.5 times better than the statistical method. Likewise, it was 2.2% more accurate and 5.12 times faster than FZWM method. <em></em></p><p class=abstract><strong>Conclusion:</strong> Using PCA with combinational averaging in samples and eigenvectors can be a novel method for recognition of Farsi characters.</p>
Keywords Farsi character recognition ,Image processing ,Principal component analysis ,Combined algorithm
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved