|
|
تنظیم مستقیم ماشین بردار پشتیبان برای دستهبندی مجموعه دادههای نامتوازن
|
|
|
|
|
نویسنده
|
مفتاحی سعید ,طاهری محمد ,حمزه علی
|
منبع
|
بيستمين سمپوزيوم بينالمللي هوش مصنوعي و پردازش سيگنال - 1402 - دوره : 20 - بیستمین سمپوزیوم بینالمللی هوش مصنوعی و پردازش سیگنال - کد همایش: 02230-38445 - صفحه:0 -0
|
چکیده
|
چکیده - یکی از چالشهای مهم در زمینه دادهکاوی مسئله دستهبندی مجموعه دادههای نامتوازن است. به گونهای که تعداد نمونههای یک کلاس از باقی کلاسها کمتر است. همچنین یکی از مدلهای دستهبندی، ماشینهای بردار پشتیبان است که به دلیل رویکرد پهن حاشیه و تعمیمپذیری مناسبی که دارد از محبوبیت بالایی برخوردار است. در واقع این الگوریتم صحت عملکرد (accuracy) را در کنار خطای ساختاری مدل بهینه میکند که در دادههای نامتوازن، منجر به تضعیف دستهبندی دادههای اقلیت میشود. یکی از شیوههای مقابله با عدم توازن بهینه کردن معیاری مانند f-measure است که متناسب با شرایط عدم توازن طراحی شده است. از سوی دیگر خروجی مدل بردار پشتیبان بسیار وابسته به یک ضریب است که وظیفه تنظیم بین خطای تجربی و ساختاری را به عهده دارد. در این مقاله با بررسی مدل در تمام مسیر تنظیم، مقدار این ضریب مستقیماً به گونههایی تعیین میشود که عملکرد نهایی از منظر f-measure روی دادههای اعتبارسنجی بیشینه شود. پیچیدگی محاسباتی مدل نهایی به دست آمده از نتایج مطلوبی در مقایسه با روشهای پایه روی تعدادی از مجموعه دادههای نامتوازن برخوردار است.
|
کلیدواژه
|
دستهبند کارا،ضریب تنظیم،ماشین بردار پشتیبان،دادههای نامتوازن
|
آدرس
|
, iran, , iran, , iran
|
پست الکترونیکی
|
ali@cse.shirazu.ac.ir
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|