استفاده از خوشهبندی و رویکردی ترکیبی برای پرکردن مقادیر جاافتاده عددی
|
|
|
|
|
نویسنده
|
سفیدیان امیرمسعود ,دانشپور نگین
|
منبع
|
مهندسي برق و مهندسي كامپيوتر ايران - 1396 - دوره : 15 - شماره : 3 - صفحه:233 -242
|
چکیده
|
تخمین مقادیر جاافتاده یک گام مهم در پیشپردازش دادهها است. در این مقاله یک رویکرد دومرحلهای برای پرکردن مقادیر جاافتاده عددی ارائه شده است. در مرحله اول دادهها خوشهبندی میشوند و در مرحله دوم دادههای جاافتاده درون هر خوشه با استفاده از یک روش ترکیبی از k نزدیکترین همسایه وزندار و رگرسیون خطی تخمین زده میشوند. از معیار همبستگی بین صفات در هر خوشه برای تعیین روش پرکردن دادههای جاافتاده استفاده میشود. کیفیت پرکردن مقادیر جاافتاده با استفاده از معیار میانگین مربعات خطا سنجیده میشود. تاثیر پارامترهای مختلف بر میزان خطای دادههای تخمین زده شده بررسی میگردد. عملکرد روش ارائهشده برای تخمین دادههای جاافتاده بر روی پنج مجموعه داده نیز بررسی میشود. در نهایت عملکرد روش ارائهشده با چهار روش پرکردن با مقدار میانگین، روش تخمین با شبکه عصبی پرسپترون چندلایه (mlp)، روش پرکردن با خوشهبندی cmeans فازی و روش k خوشه و نزدیکترین همسایه مبتنی بر دسته (cknni) مقایسه میشود. نتایج به دست آمده نشان داده که خطای تخمین مقادیر جاافتاده در روش ارائهشده کمتر از خطا در دیگر روشهای مقایسهشده است.
|
کلیدواژه
|
رگرسیون، مقادیر جاافتاده، نزدیکترین همسایگان، همبستگی
|
آدرس
|
دانشگاه تربیت دبیر شهید رجایی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه تربیت دبیر شهید رجایی, دانشکده مهندسی کامپیوتر, ایران
|
پست الکترونیکی
|
ndaneshpour@srttu.edu
|
|
|
|
|