>
Fa   |   Ar   |   En
   حذف افزونگی داده‌های خام از مجموعه داده‌ها، با استفاده از تحلیل مولفه‌های اصلی ‌تُنُک  
   
نویسنده شریفی نجف آبادی علی اصغر ,ترکمنی آذر فرح
منبع ماشين بينايي و پردازش تصوير - 1398 - دوره : 6 - شماره : 1 - صفحه:19 -30
چکیده    تحلیل مولفه‌های اصلی یکی از روش‌های مطرح به منظور کاهش ابعاد مجموعه داده است که برای داده‌های یک بُعدی و دوبُعدی قابل استفاده است. با توجه به تُنُک نبودن بردارهای پایه‌، تحلیل مولفه‌های اصلی تُنُک مطرح گردیده است که با حفظ خواص تحلیل مولفه‌های اصلی استاندارد، بعضی از درایه‌های بردارهای پایه را صفر می‌کند. در این مقاله، با توجه به خاصیت تُنُکی بردارهای پایه، که سبب بی تاثیر گشتن بعضی از مقادیر مجموعه داده در انتقال به فضای جدید می گردد، دو آلگوریتم به منظور حذف افزونگی از داده‌های خام، در حالت یک بُعدی و دوبُعدی ارائه شده‌است. در الگوریتم یک بُعدی، افزونگی بین درایه های سیگنال تشخیص و سپس از تمامی مشاهدات مجموعه حذف می‌شوند. در الگوریتم دوبُعدی اهمیت سطر وستون‌های تصاویر مجموعه داده، تشخیص و سطر وستون‌های با اهمیت کمتر به طور مستقیم از داده‌های خام حذف می‌شوند. یکی از مهمترین مزیت آلگوریتم های پیشنهادی که به عنوان روش های نمونه برداری غیریکنواخت نیز میتوانند خوانده شوند، حفظ ظاهر سیگنال ها می باشد. پس از حذف افزونگی داده‌های خام توسط دو الگوریتم ارائه شده، می‌توان از داده‌های جدید با ابعاد کمتر در کاربردهای دیگری همچون بازشناسی مجموعه داده، فشرده سازی و ... استفاده کرد
کلیدواژه حذف افزونگی از داده‌های خام، تحلیل مولفه‌های اصلی تُنُک، تحلیل مولفه‌های اصلی دوبُعدی دوطرفه تُنُک، استخراج ویژگی
آدرس دانشگاه شهید بهشتی, ایران, دانشگاه شهید بهشتی, دانشکده مهندسی برق, آزمایشگاه پردازش سیگنال های دیجیتال, ایران
پست الکترونیکی f-torkamani@sbu.ac.ir
 
   Removing redundant raw data from the data set using Sparse Component Analysis  
   
Authors Sharifi Najafabadi Ali Asghar ,Torkamnai Azar Farah
Abstract    Principal component analysis (PCA) is one of the proposed methods to reduce the size of the data set that can be used for both one and twodimensional data. Regarding the lack of sparsity property in the base vectors, sparse PCA has been proposed, which maintains the properties of standard PCA and simultaneously forces some of the elements of the base vectors to zero. In this paper, due to the sparsity in base vectors that cause some dataset values to be ineffective in moving to new space, two algorithms are presented in onedimensional and twodimensional mode to remove redundancy from raw data. In the onedimensional algorithm, redundancy is detected between signal layers and then removed from all set observations. In a twodimensional algorithm, the significance of the row and the column of the dataset images are detected and the less important ones are eliminated directly from raw data. One of the most important advantages of proposed algorithms, which can be read as nonuniform sampling methods, is to preserve the appearance of signals. After removing the raw data redundancy by the two algorithms presented, new data with fewer dimensions can be used in other applications such as dataset recognition, compression, and so on.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved