|
|
حذف افزونگی دادههای خام از مجموعه دادهها، با استفاده از تحلیل مولفههای اصلی تُنُک
|
|
|
|
|
نویسنده
|
شریفی نجف آبادی علی اصغر ,ترکمنی آذر فرح
|
منبع
|
ماشين بينايي و پردازش تصوير - 1398 - دوره : 6 - شماره : 1 - صفحه:19 -30
|
|
|
چکیده
|
تحلیل مولفههای اصلی یکی از روشهای مطرح به منظور کاهش ابعاد مجموعه داده است که برای دادههای یک بُعدی و دوبُعدی قابل استفاده است. با توجه به تُنُک نبودن بردارهای پایه، تحلیل مولفههای اصلی تُنُک مطرح گردیده است که با حفظ خواص تحلیل مولفههای اصلی استاندارد، بعضی از درایههای بردارهای پایه را صفر میکند. در این مقاله، با توجه به خاصیت تُنُکی بردارهای پایه، که سبب بی تاثیر گشتن بعضی از مقادیر مجموعه داده در انتقال به فضای جدید می گردد، دو آلگوریتم به منظور حذف افزونگی از دادههای خام، در حالت یک بُعدی و دوبُعدی ارائه شدهاست. در الگوریتم یک بُعدی، افزونگی بین درایه های سیگنال تشخیص و سپس از تمامی مشاهدات مجموعه حذف میشوند. در الگوریتم دوبُعدی اهمیت سطر وستونهای تصاویر مجموعه داده، تشخیص و سطر وستونهای با اهمیت کمتر به طور مستقیم از دادههای خام حذف میشوند. یکی از مهمترین مزیت آلگوریتم های پیشنهادی که به عنوان روش های نمونه برداری غیریکنواخت نیز میتوانند خوانده شوند، حفظ ظاهر سیگنال ها می باشد. پس از حذف افزونگی دادههای خام توسط دو الگوریتم ارائه شده، میتوان از دادههای جدید با ابعاد کمتر در کاربردهای دیگری همچون بازشناسی مجموعه داده، فشرده سازی و ... استفاده کرد
|
کلیدواژه
|
حذف افزونگی از دادههای خام، تحلیل مولفههای اصلی تُنُک، تحلیل مولفههای اصلی دوبُعدی دوطرفه تُنُک، استخراج ویژگی
|
آدرس
|
دانشگاه شهید بهشتی, ایران, دانشگاه شهید بهشتی, دانشکده مهندسی برق, آزمایشگاه پردازش سیگنال های دیجیتال, ایران
|
پست الکترونیکی
|
f-torkamani@sbu.ac.ir
|
|
|
|
|
|
|
|
|
Removing redundant raw data from the data set using Sparse Component Analysis
|
|
|
Authors
|
Sharifi Najafabadi Ali Asghar ,Torkamnai Azar Farah
|
Abstract
|
Principal component analysis (PCA) is one of the proposed methods to reduce the size of the data set that can be used for both one and twodimensional data. Regarding the lack of sparsity property in the base vectors, sparse PCA has been proposed, which maintains the properties of standard PCA and simultaneously forces some of the elements of the base vectors to zero. In this paper, due to the sparsity in base vectors that cause some dataset values to be ineffective in moving to new space, two algorithms are presented in onedimensional and twodimensional mode to remove redundancy from raw data. In the onedimensional algorithm, redundancy is detected between signal layers and then removed from all set observations. In a twodimensional algorithm, the significance of the row and the column of the dataset images are detected and the less important ones are eliminated directly from raw data. One of the most important advantages of proposed algorithms, which can be read as nonuniform sampling methods, is to preserve the appearance of signals. After removing the raw data redundancy by the two algorithms presented, new data with fewer dimensions can be used in other applications such as dataset recognition, compression, and so on.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|