توسعه روش طبقه‌بندی دیتاست‌های نامتوازن با استفاده از الگوریتم‌های تکاملی چندهدفه

Fa | Ar | En

توسعه روش طبقه‌بندی دیتاست‌های نامتوازن با استفاده از الگوریتم‌های تکاملی چندهدفه


نویسنده	دانشور امیر ,همایون فر مهدی ,اخوان الهام
منبع	مطالعات مديريت صنعتي - 1398 - دوره : 17 - شماره : 55 - صفحه:161 -183
چکیده	طبقه‌بندی داده‌ها از مباحث اساسی علم مدیریت است که از رویکردهای مختلفی مورد بررسی قرار گرفته است. روش‌های هوش مصنوعی از مهمترین روش‌های طبقه‌بندی هستند که اغلب آنها تابع دقت کل را در ارزیابی عملکرد مد نظر قرار می‌دهند. از آنجاییکه در دیتاست‌های نامتوازن، این تابع، هزینه‌ خطاهای پیش‌بینی را یکسان در نظر می‌گیرد، در این پژوهش علاوه بر تابع دقت کل، از تابع حساسیت نیز به منظور افزایش دقت در هر یک از کلاس‌های از پیش‌تعریف‌شده، استفاده شده است. به‌علاوه، بدلیل پیچیدگی فرآیند کسب اطلاعات از تصمیم‌گیرنده، از الگوریتم فرا ابتکاری nsga ii جهت استنتاج مقادیر پارامترها، (بردار وزن و سطوح برش بین کلاس‌ها) استفاده گردیده است. در هر تکرار، الگوریتم با استفاده از بردار وزن برآورد شده و دیتاست‌ها، امتیاز هر آلترناتیو را با تابع sum product محاسبه نموده و در مقایسه با سطوح برش تخمینی، آن آلترناتیو را به یکی از دسته‌ها تخصیص می‌دهد. سپس با استفاده از توابع برازش، دسته تخمینی و دسته واقعی را مقایسه نموده و این فرایند تا بهینه‌سازی پارامترها ادامه می‌یابد. مقایسه نتایج الگوریتم‌های nsga ii و nrga، نشان‌دهنده کارایی بالای الگوریتم ارائه شده است.
کلیدواژه	الگوریتم ژنتیک با رتبه‌بندی نامغلوب (nsga ii)، طبقه‌بندی چند کلاسه، دیتاست‌های نامتوازن، الگوریتم nrga
آدرس	دانشگاه آزاد اسلامی واحد الکترونیکی, گروه مدیریت فناوری اطلاعات, ایران, دانشگاه آزاد اسلامی واحد رشت, دانشکده مدیریت و حسابداری, ایران, دانشگاه آزاد اسلامی واحد الکترونیکی, دانشکده مدیریت, ایران

Developing a classification Method for Imbalanced Dataset Using MultiObjective Evolutionary Algorithms

Authors	daneshvar amir ,Homayounfar Mahdi ,akhavan elham
Abstract	Data classification is one of the main issues in management science which took into account from different approaches. Artificial intelligence methods are among the most important classification methods, most of them consider total accuracy function in performance evaluation. Since in imbalanced data sets this function considers the cost of prediction errors as a fix amount, in this research a sensitivity function in used in addition to the accuracy function in order to increase the accuracy in all of the predefined classes. In addition, due to complexity in process of seeking information from decision maker, NSGA II algorithm is used to extract the parameters (Weight vector and cut levels between classes). In each iteration, based on the estimated weight vector and data sets, the algorithm calculate the score of each alternative using Sum Product function and then allocates the alternative to one of the classes, comparing to the estimated cut levels,. Then, using the fitness functions, the estimation class and the actual class will compare by two algorithms and this process will continue since optimizing the parameters. Comparison of the NSGA II and NRGA algorithms show the high efficiency of the proposed algorithm.
Keywords