|
|
ترکیب تکنیک های انتخاب نمونه و داده افزایی برای حل مسئله طبقهبندی مجموعه دادههای نامتوازن
|
|
|
|
|
نویسنده
|
محقق پرستو ,نوفرستی سمیرا ,رجائی مهری
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1402 - دوره : 21 - شماره : 4 - صفحه:273 -283
|
چکیده
|
در عصر کلان دادهها، تکنیکهای تجزیه و تحلیل خودکار مانند دادهکاوی بهطور گستردهای برای تصمیمگیری بهکار گرفته شده و بسیار موثر واقع شدهاند. از جمله تکنیکهای دادهکاوی میتوان به طبقهبندی اشاره کرد که یک روش رایج برای تصمیمگیری و پیشبینی است. الگوریتمهای طبقهبندی بهطور معمول بر روی مجموعه دادههای متوازن بهخوبی عمل میکنند. با وجود این، یکی از مشکلاتی که الگوریتمهای طبقهبندی با آن مواجه هستند، پیشبینی صحیح برچسب نمونههای جدید بر اساس یادگیری بر روی مجموعه دادههای نامتوازن است. در این نوع از مجموعه دادهها، توزیع ناهمگونی که دادهها در کلاسهای مختلف دارند باعث نادیده گرفتهشدن نمونههای کلاس با تعداد نمونه کمتر در یادگیری طبقهبند میشوند؛ در حالی که این کلاس در برخی مسائل پیشبینی دارای اهمیت بیشتری است. بهمنظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادلسازی مجموعه دادههای نامتوازن ارائه میشود که با متعادلنمودن تعداد نمونههای کلاسهای مختلف در مجموعه دادهای نامتوازن، پیشبینی صحیح برچسب کلاس نمونههای جدید توسط الگوریتم یادگیری ماشین را بهبود میبخشد. بر اساس ارزیابیهای صورتگرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقهبندی مجموعه دادههای نامتوازن به نامهای «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روشهای دیگر دارد.
|
کلیدواژه
|
انتخاب نمونه، داده افزایی، طبقهبندی، مجموعه داده نامتوازن، دادهکاوی، یادگیری ماشین
|
آدرس
|
دانشگاه سیستان و بلوچستان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه سیستان و بلوچستان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه سیستان و بلوچستان, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
rajayi@ece.usb.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|