اعمال مدلهای رگرسیون بر زیرمجموعههای با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی
|
|
|
|
|
نویسنده
|
سفیدیان امیرمسعود ,دانشپور نگین
|
منبع
|
مهندسي برق دانشگاه تبريز - 1397 - دوره : 48 - شماره : 3 - صفحه:1187 -1200
|
چکیده
|
حضور مقادیر جاافتاده در دادههای دنیای واقعی مشکلی بسیار رایج و غیرقابلاجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده بهطور دقیق پُر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد میشود. در تمامی روشهای پیشنهادی، مدلهای رگرسیون بر زیرمجموعههایی با همبستگی بالا اعمال میشوند. در انتخاب زیرمجموعههای مطلوب سعی میشود تا همبستگی بین صفت جاافتاده و دیگر صفات حداکثر شود. انتخاب این زیرمجموعهها با استفاده از رویکردهایی مبتنی بر انتخاب روبهجلو انجام میشود. از معیار ضریب همبستگی برای اندازهگیری میزان ارتباط بین صفات استفادهشده است. همچنین در روشهای پیشنهادی، ترتیب صفات جاافتاده برای انجام عمل جایگذاری اولویتدهی میشوند. عملکرد رویکردهای پیشنهادشده بر روی پنج مجموعهداده از دنیای واقعی با مقادیر مختلف جاافتادگی ارزیابیشده است. عملکرد رویکردهای ارائهشده با پنج رویکرد جایگذاری با مقدار میانگین، جایگذاری با استفاده از نزدیکترین همسایگان، روش جایگذاری با خوشهبندی cmeans فازی، روش جایگذاری با درخت تصمیم و روشی مبتنی بر رگرسیون به نام «الگوریتم جایگذاری با رگرسیون افزایشیِ صفات» (iari) مقایسه شده است. از دو معیار شناختهشدهی ریشه میانگین مربعات خطا و ضریب تعیین برای مقایسه عملکرد رویکردهای پیشنهادی با دیگر روشهای جایگذاری استفادهشده است. نتایج آزمایشها نشان میدهد که رویکردهای ارائهشده، حتی زمانی که درصد جاافتادگی بالا است، بهتر از دیگر روشهای مقایسه شده عمل میکنند.
|
کلیدواژه
|
جایگذاری مقادیر جاافتاده، همبستگی، رگرسیون
|
آدرس
|
دانشگاه تربیت دبیر شهید رجایی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه تربیت دبیر شهید رجایی, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
ndaneshpour@sru.ac.ir
|
|
|
|
|