|
|
کاهش فضای جستجو برای بازشناسی زیرکلمات تایپی فارسی با استفاده از ویژگیهای ساده، کوانتیزاسیون ویژگی و ترکیب طبقهبندها
|
|
|
|
|
نویسنده
|
میری اسماعیل ,رضوی سیّد محمّد ,مهرشاد ناصر
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1399 - دوره : 9 - شماره : 2 - صفحه:61 -73
|
چکیده
|
در این مقاله روشی برای کاهش فضای جستجو در بازشناسی زیرکلمات چاپی فارسی ارائه میشود. ابتدا 10 ویژگی ساده از زیرکلمه استخراج میشود. با استفاده از مفهوم کوانتیزاسیون و با توجه به بازه تغییرات هر ویژگی روی همه دادههای آموزشی ویژگیها کوانتیزه شده و به اعداد صحیحی تبدیل میشوند. با استفاده از هر ویژگی و فاصله آن تا ویژگی متناظر هر کدام از نمونههای آموزشی، به هر کلاس امتیازی داده میشود. با اعمال همه ویژگیها، هر کلاس به ازای هر ویژگی یک امتیاز دارد که با ترکیب این امتیازات با اعمال جبری یک امتیاز نهایی برای هر زیرکلمه بدست میآید که با مرتب کردن آنها و انتخاب تعدادی از آنها که امتیاز بیشتری دارند، فضای جستجو محدود میشود. از اعمال جبری جمع، ضرب، بیشینه، کمینه و جمع وزندار برای ترکیب امتیازات استفاده شده است. روش جمع وزن دار، که وزنهای بهینه با الگوریتم بهینهسازی جمعیت ذرات تعیین شدهاند، بهترین پاسخ را داده است.
|
کلیدواژه
|
بازشناسی زیرکلمات فارسی، بهینهسازی جمعیت ذرات، ترکیب طبقهبندها، کاهش فضای جستجو، کوانتیزاسیون ویژگی
|
آدرس
|
دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه بیرجند, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
nmehrshad@birjand.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|