|
|
بررسی عملکرد الگوریتم های یادگیری ماشین در تشخیصنویسه های اعداد فارسی
|
|
|
|
|
نویسنده
|
عتیقی محراب ,رستمی آتوسا ,میرکمالی جمال
|
منبع
|
شانزدهمين كنفرانس آمار ايران - 1401 - دوره : 16 - شانزدهمین کنفرانس آمار ایران - کد همایش: 01220-18271 - صفحه:0 -0
|
چکیده
|
در این مقاله پردازشتصاویر نویسه های اعداد فارسی با هدف تشخیصنوری نویسه ها (ocr) با سه الگوریتم یادگیری ماشین شامل رگرسیون لجستیک چندجمله ای، ماشین بردار پشتیبان، و جنگل تصادفی صورت گرفته است.عد و انتخاب ویژگی بر عملکرد هدف اصلی یافتن مدل بهینه از نظر دقت و زمان پردازش و نیز بررسی اثر کاهش بعد تحلیل مولفه های اصلی و تحلیل تناظر چندمتغیره الگوریتم های مورد استفاده است. در این مقاله دو روش کاهش ببا تعداد مولفه های متفاوت و یک الگوی انتخاب ویژگی و جمعا 30 مدل مختلف مورد بررسی قرار گرفته و مدل هابر حسب دقت پیش بینی روی مجموعه داده های آزمایش و زمان مورد نیاز برای پیش بینی ارزیابی شده اند. با بررسیعد تحلیل مولفه های به عمل آمده برترین عملکرد مربوط به الگوریتم ماشین بردار پشتیبان با انتخاب ویژگی و کاه
|
کلیدواژه
|
رگرسیون لجستیک چن دجمله ای، ماشین بردار پشتیبان، الگوریتم جنگل تصادفی
|
آدرس
|
, iran, , iran, , iran
|
|
|
|
|
|
|
|
|
|
|
a performance study of machine learning algorithms in recognition ofhandwritten persian digits
|
|
|
Authors
|
|
Abstract
|
in this paper, we studied three machine learning algorithms, i.e. multinomial logisticregression, support vector machine, and random forests to recognize handwritten persiandigits. we studied two methods for dimension reduction and a feature selection method,and a total of 30 models were investigated. according to the results, we suggest the supportvector machine with feature selection and principal components as the best mode
|
Keywords
|
multinomial logistic regression ,svm ,random forest ,ocr.
|
|
|
|
|
|
|
|
|
|
|