>
Fa   |   Ar   |   En
   استفاده از خوشه‌بندی و رویکردی ترکیبی برای پرکردن مقادیر جاافتاده عددی  
   
نویسنده سفیدیان امیرمسعود ,دانشپور نگین
منبع مهندسي برق و مهندسي كامپيوتر ايران - 1396 - دوره : 15 - شماره : 3 - صفحه:233 -242
چکیده    تخمین مقادیر جاافتاده یک گام مهم در پیش‌پردازش داده‌ها است. در این مقاله ‌یک رویکرد دومرحله‌ای برای پرکردن مقادیر جاافتاده عددی ارائه شده است. در مرحله اول داده‌ها خوشه‌بندی می‌شوند و در مرحله دوم داده‌های جاافتاده درون هر خوشه با استفاده از یک روش‌ ترکیبی از k نزدیک‌ترین همسایه وزن‌دار و رگرسیون خطی تخمین زده می‌شوند. از معیار همبستگی بین صفات در هر خوشه برای تعیین روش پرکردن داده‌های جاافتاده استفاده می‌‌شود. کیفیت پرکردن مقادیر جاافتاده با استفاده از معیار میانگین مربعات خطا سنجیده می‌شود. تاثیر پارامترهای مختلف بر میزان خطای داده‌های تخمین زده شده بررسی می‌‌گردد. عملکرد روش ارائه‌شده برای تخمین داده‌های جاافتاده بر روی پنج مجموعه داده نیز‌ بررسی می‌شود. در نهایت عملکرد روش ارائه‌شده با چهار روش پرکردن با مقدار میانگین، روش تخمین با شبکه عصبی پرسپترون چندلایه (mlp)، روش پرکردن با خوشه‌بندی cmeans فازی و روش k خوشه‌ و نزدیک‌ترین همسایه مبتنی بر دسته (cknni) مقایسه می‌شود. نتایج به دست آمده نشان داده‌ که خطای تخمین مقادیر جاافتاده در روش ارائه‌شده کمتر از خطا در دیگر روش‌های مقایسه‌شده است.
کلیدواژه رگرسیون، مقادیر جاافتاده، نزدیک‌ترین همسایگان، همبستگی
آدرس دانشگاه تربیت دبیر شهید رجایی, دانشکده مهندسی کامپیوتر, ایران, دانشگاه تربیت دبیر شهید رجایی, دانشکده مهندسی کامپیوتر, ایران
پست الکترونیکی ndaneshpour@srttu.edu
 
   Using Clustering and a Hybrid Method to Fill the Numeric Missing Values  
   
Authors Sefidian A. M.
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved