ترکیب تکنیک ‌های انتخاب نمونه و داده ‌افزایی برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن

Fa | Ar | En

ترکیب تکنیک ‌های انتخاب نمونه و داده ‌افزایی برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن


نویسنده	محقق پرستو ,نوفرستی سمیرا ,رجائی مهری
منبع	مهندسي برق و مهندسي كامپيوتر ايران - 1402 - دوره : 21 - شماره : 4 - صفحه:273 -283
چکیده	در عصر کلان‌ داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار موثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌بندی به‌طور معمول بر روی مجموعه داده‌های متوازن به‌خوبی عمل می‌کنند. با وجود این، یکی از مشکلاتی که الگوریتم‌های طبقه‌بندی با آن مواجه هستند، پیش‌بینی صحیح برچسب نمونه‌های جدید بر اساس یادگیری بر روی مجموعه داده‌های نامتوازن است. در این نوع از مجموعه داده‌ها، توزیع ناهمگونی که داده‌ها در کلاس‌های مختلف دارند باعث نادیده گرفته‌شدن نمونه‌های کلاس با تعداد نمونه کمتر در یادگیری طبقه‌بند می‌شوند؛ در حالی که این کلاس در برخی مسائل پیش‌بینی دارای اهمیت بیشتری است. به‌منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل‌سازی مجموعه داده‌های نامتوازن ارائه می‌شود که با متعادل‌نمودن تعداد نمونه‌های کلاس‌های مختلف در مجموعه داده‌ای نامتوازن، پیش‌بینی صحیح برچسب کلاس نمونه‌های جدید توسط الگوریتم یادگیری ماشین را بهبود می‌بخشد. بر اساس ارزیابی‌های صورت‌گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه‌بندی مجموعه داده‌های نامتوازن به نام‌های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش‌های دیگر دارد.
کلیدواژه	انتخاب نمونه، داده ‌افزایی، طبقه‌بندی، مجموعه داده نامتوازن، داده‌کاوی، یادگیری ماشین
آدرس	دانشگاه سیستان و بلوچستان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه سیستان و بلوچستان, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه سیستان و بلوچستان, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی	rajayi@ece.usb.ac.ir



Authors