بهبود الگوریتم فازی c-means با الگوریتم ژنتیک برای انتخاب ویژگی ها در دسته بندی اسناد متنی
|
|
|
|
|
نویسنده
|
سلیمانیان قره چپق فرهاد ,محمودی جاریحان ندا
|
منبع
|
علوم رايانشي - 1398 - دوره : 4 - شماره : 1 - صفحه:63 -76
|
چکیده
|
افزایش روزافزون مستندات الکترونیکی در وب، لزوم دستهبندی آنان در دستههای مختلف را نشان میدهد. با توجه به حجم و دامنه وسیع اسناد متنی که بهطور قابل توجهی از طریق محیطهای برخط و سایر منابع قابل دسترسی میباشند، در صورت عدم دستهبندی مناسب، عمل بازیابی و پردازش اسناد متنی دستهبندی نشده با مشکلات زیادی مواجه میگردد. این نیاز منجر به ایجاد روشهای نوین برای دستهبندی اطلاعات شده است. دستهبندی، تخصیص اسناد متنی یا ویژگیها به یک یا چندین دسته است، بهطوری که اسناد متنی با توجه به موضوعات یا میزان مشابهت ویژگیها میتوانند دستهبندی گردند. در ارائه روشهای دستهبندی، استخراج و انتخاب ویژگیهای کلیدی اسناد متنی از اهمیت بالایی برخودار میباشد. در این مقاله روشی براساس بهبود الگوریتم فازی c-means با الگوریتم ژنتیک برای انتخاب ویژگیها در دستهبندی اسناد متنی ارائه شده است که در روش پیشنهادی انتخاب ویژگیهای کلیدی متون از طریق الگوریتم فازی c-means انجام میشود و این ویژگیها به الگوریتم ژنتیک جهت بهبود در دستهبندی ارسال میگردند. روش پیشنهادی بر روی سه مجموعهدادهی مختلف reuters21578, webkb, cade 12 و بر اساس معیارهای ارزیابی مختلفی مورد آزمایش و ارزیابی قرار گرفته است. مقایسهی نتایج روش پیشنهادی با سایر روشهای مطرح در دستهبندی متون نشان میدهد که روش پیشنهادی عملکرد بهینهای را در دستهبندی اسناد متنی دارد.
|
کلیدواژه
|
دسته بندی اسناد متنی، بهینه سازی، انتخاب ویژگی، الگوریتم فازی c-means، الگوریتم ژنتیک.
|
آدرس
|
دانشگاه آزاد اسلامی واحد ارومیه, گروه مهندسی کامپیوتر, ایران, دانشگاه آزاد اسلامی واحد ارومیه, گروه مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
nmahmoodi510@gmail.com
|
|
|
|
|