|
|
|
|
استفاده از الگوریتم آنالیز اجزای اصلی جهت تشخیص نرم افزاری حروف در متون فارسی
|
|
|
|
|
|
|
|
نویسنده
|
گشمرد شهروز ,مهری دهنوی علیرضا ,ربانی حسین
|
|
منبع
|
مجله دانشكده پزشكي اصفهان - 1390 - دوره : 29 - شماره : 174 - صفحه:3211 -3220
|
|
چکیده
|
مقدمه: ابداع روش منابع گویای خودکار، همواره یکی از دغدغههای فکری پژوهشگران بوده است تا ابزاری کارآمد جهت مطالعهی متون معمولی توسط نابینایان تولید نمایند. در این راه، علاوه بر تلاش در جهت ساخت ابزارها، روشهای بهینه جهت پردازش، شناخت و تفکیک نوشتهها و متون فارسی نیز مورد نیاز میباشد.روشها: در این مقاله با استفاده از روش آنالیز اجزای اصلی، روشی جدید جهت تشخیص اتوماتیک حروف در تصاویر تهیه شده از حروف فارسی تایپ شده ارایه میگردد که قادر به بهبود روشهای موجود از لحاظ دقت و سرعت میباشد. در این روش، که برگرفته از روش آنالیز اجزای اصلی میباشد، در اصل اجزای وابسته به تغییرات کم از دادهها حذف میشود و بدون از دست رفتن قسمت عمدهی اطلاعات تصویر، میتوان شباهتها و اختلافات بین تصاویر مختلف را با سرعت و دقت بیشتری مورد بررسی قرار داد.یافتهها: در این مقاله با انجام آزمایشهای عملی متعدد، کارآیی بهتر روش اجزای اصلی در مقایسه با روشهای قبلی مانند روشهای آماری و زرنیک سریع مورد تایید قرار گرفته است. برای مثال با آزمایش هر سه این روشها بر یک مجموعهی دادهی آموزشی یکسان و چهار مجموعهی دادهی آزمونی یکسان، مشخص گردید که دقت این روش در مقایسه با روش آماری 1.775 درصد بهتر و سرعت آن 7.5 برابر شده است و در مقایسه با روش زرنیک سریع دقت 2.2 درصد بهبود داشته و سرعت آن نیز 5.12 برابر بیشتر شده است.نتیجهگیری: مقایسهی نتایج نهایی اعمال دادهها به الگوریتمهای مطرح شده در مقاله و مقایسهی دقت و زمان آنها نشان داد که الگوریتم آنالیز اجزای اصلی (pca) ترکیبی بهترین نتایج از لحاظ سرعت و دقت را به همراه دارد.
|
|
کلیدواژه
|
الگوریتم ترکیبی و آنالیز اجزای اصلی، پردازش تصویر، شناسایی حروف فارسی
|
|
آدرس
|
دانشگاه علوم پزشکی اصفهان, دانشکده ی پزشکی, گروه فیزیک و مهندسی پزشکی, ایران, دانشگاه علوم پزشکی اصفهان, دانشکده ی پزشکی, گروه فیزیک و مهندسی پزشکی, ایران, دانشگاه علوم پزشکی اصفهان, دانشکده ی پزشکی، مرکز تحقیقات پردازش تصویر و سیگنال پزشکی, گروه فیزیک و مهندسی پزشکی, ایران
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Using Principal Component Analysis to Recognize Farsi Alphabetic Characters in Printed Scripts
|
|
|
|
|
Authors
|
Gashmard Shahrouz ,Mehri Dehnavi Alireza ,Rabbani Hossein
|
|
Abstract
|
<p class=abstract><strong>Background:</strong> From the early stages of script writing and reading, there was a big desire for researchers to make an aid device for the blind to read scripts without help of other. This paper introduced a new approach for recognition of Farsi scripts using principal component analysis (PCA).</p><p class=abstract><strong>Methods: </strong>Materials used for this project were selected from ordinary books, magazines, newspapers, and printed documents. Character samples were selected from four fonts in different positions and three sizes resulted in total number of 20 recognition classes. The five methods used in character recognition were statistical method, Fast Zernike Wavelet Moments (FZWM) method, PCA, PCA with sample averaging, and PCA with eigenvectors averaging.</p><p class=abstract><strong>Findings: </strong>The accuracy and speed of PCA in recognition of Farsi characters were respectively 1.775% and 7.5 times better than the statistical method. Likewise, it was 2.2% more accurate and 5.12 times faster than FZWM method. <em></em></p><p class=abstract><strong>Conclusion:</strong> Using PCA with combinational averaging in samples and eigenvectors can be a novel method for recognition of Farsi characters.</p>
|
|
Keywords
|
Farsi character recognition ,Image processing ,Principal component analysis ,Combined algorithm
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|