|
|
توسعه روش طبقهبندی دیتاستهای نامتوازن با استفاده از الگوریتمهای تکاملی چندهدفه
|
|
|
|
|
نویسنده
|
دانشور امیر ,همایون فر مهدی ,اخوان الهام
|
منبع
|
مطالعات مديريت صنعتي - 1398 - دوره : 17 - شماره : 55 - صفحه:161 -183
|
|
|
چکیده
|
طبقهبندی دادهها از مباحث اساسی علم مدیریت است که از رویکردهای مختلفی مورد بررسی قرار گرفته است. روشهای هوش مصنوعی از مهمترین روشهای طبقهبندی هستند که اغلب آنها تابع دقت کل را در ارزیابی عملکرد مد نظر قرار میدهند. از آنجاییکه در دیتاستهای نامتوازن، این تابع، هزینه خطاهای پیشبینی را یکسان در نظر میگیرد، در این پژوهش علاوه بر تابع دقت کل، از تابع حساسیت نیز به منظور افزایش دقت در هر یک از کلاسهای از پیشتعریفشده، استفاده شده است. بهعلاوه، بدلیل پیچیدگی فرآیند کسب اطلاعات از تصمیمگیرنده، از الگوریتم فرا ابتکاری nsga ii جهت استنتاج مقادیر پارامترها، (بردار وزن و سطوح برش بین کلاسها) استفاده گردیده است. در هر تکرار، الگوریتم با استفاده از بردار وزن برآورد شده و دیتاستها، امتیاز هر آلترناتیو را با تابع sum product محاسبه نموده و در مقایسه با سطوح برش تخمینی، آن آلترناتیو را به یکی از دستهها تخصیص میدهد. سپس با استفاده از توابع برازش، دسته تخمینی و دسته واقعی را مقایسه نموده و این فرایند تا بهینهسازی پارامترها ادامه مییابد. مقایسه نتایج الگوریتمهای nsga ii و nrga، نشاندهنده کارایی بالای الگوریتم ارائه شده است.
|
کلیدواژه
|
الگوریتم ژنتیک با رتبهبندی نامغلوب (Nsga Ii)، طبقهبندی چند کلاسه، دیتاستهای نامتوازن، الگوریتم Nrga
|
آدرس
|
دانشگاه آزاد اسلامی واحد الکترونیکی, گروه مدیریت فناوری اطلاعات, ایران, دانشگاه آزاد اسلامی واحد رشت, دانشکده مدیریت و حسابداری, ایران, دانشگاه آزاد اسلامی واحد الکترونیکی, دانشکده مدیریت, ایران
|
|
|
|
|
|
|
|
|
|
|
Developing a classification Method for Imbalanced Dataset Using MultiObjective Evolutionary Algorithms
|
|
|
Authors
|
Homayounfar Mahdi ,daneshvar amir ,akhavan elham
|
Abstract
|
Data classification is one of the main issues in management science which took into account from different approaches. Artificial intelligence methods are among the most important classification methods, most of them consider total accuracy function in performance evaluation. Since in imbalanced data sets this function considers the cost of prediction errors as a fix amount, in this research a sensitivity function in used in addition to the accuracy function in order to increase the accuracy in all of the predefined classes. In addition, due to complexity in process of seeking information from decision maker, NSGA II algorithm is used to extract the parameters (Weight vector and cut levels between classes). In each iteration, based on the estimated weight vector and data sets, the algorithm calculate the score of each alternative using Sum Product function and then allocates the alternative to one of the classes, comparing to the estimated cut levels,. Then, using the fitness functions, the estimation class and the actual class will compare by two algorithms and this process will continue since optimizing the parameters. Comparison of the NSGA II and NRGA algorithms show the high efficiency of the proposed algorithm.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|