بهبود الگوریتم فازی c-means با الگوریتم ژنتیک برای انتخاب ویژگی ها در دسته بندی اسناد متنی

Fa | Ar | En

بهبود الگوریتم فازی c-means با الگوریتم ژنتیک برای انتخاب ویژگی ها در دسته بندی اسناد متنی


نویسنده	سلیمانیان قره چپق فرهاد ,محمودی جاریحان ندا
منبع	علوم رايانشي - 1398 - دوره : 4 - شماره : 1 - صفحه:63 -76
چکیده	افزایش روزافزون مستندات الکترونیکی در وب، لزوم دسته‌بندی آنان در دسته‌های مختلف را نشان می‌دهد. با توجه به حجم و دامنه وسیع اسناد متنی که به‌طور قابل توجهی از طریق محیط‌های برخط و سایر منابع قابل دسترسی می‎باشند، در صورت عدم دسته‌بندی مناسب، عمل بازیابی و پردازش اسناد متنی دسته‌بندی نشده با مشکلات زیادی مواجه می‌گردد. این نیاز منجر به ایجاد روش‌های نوین برای دسته‌بندی اطلاعات شده است. دسته‌بندی، تخصیص اسناد متنی یا ویژگی‌ها به یک یا چندین دسته است، به‌طوری که اسناد متنی با توجه به موضوعات یا میزان مشابهت ویژگی‎ها می‎توانند دسته‌بندی گردند. در ارائه روش‌های دسته‎بندی، استخراج و انتخاب ویژگی‌های کلیدی اسناد متنی از اهمیت بالایی برخودار می‎باشد. در این مقاله روشی براساس بهبود الگوریتم فازی c-means با الگوریتم ژنتیک برای انتخاب ویژگی‌ها در دسته‏بندی اسناد متنی ارائه شده است که در روش پیشنهادی انتخاب ویژگی‌های کلیدی متون از طریق الگوریتم فازی c-means انجام می‎شود و این ویژگی‎ها به الگوریتم ژنتیک جهت بهبود در دسته‏بندی ارسال می‏گردند. روش پیشنهادی بر روی سه مجموعه‏داده‎ی مختلف reuters21578, webkb, cade 12 و بر اساس معیارهای ارزیابی مختلفی مورد آزمایش و ارزیابی قرار گرفته است. مقایسه‎ی نتایج روش پیشنهادی با سایر روش‌های مطرح در دسته‏بندی متون نشان می‎دهد که روش پیشنهادی عملکرد بهینه‏ای را در دسته‏بندی اسناد متنی دارد.
کلیدواژه	دسته بندی اسناد متنی، بهینه سازی، انتخاب ویژگی، الگوریتم فازی c-means، الگوریتم ژنتیک.
آدرس	دانشگاه آزاد اسلامی واحد ارومیه, گروه مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد ارومیه, گروه مهندسی کامپیوتر, ایران
پست الکترونیکی	nmahmoodi510@gmail.com



Authors