|
|
تُنُکسازی مولفههای اصلی در حضور نقاط دوراُفتاده
|
|
|
|
|
نویسنده
|
رزاقی امیر ,گلعلی زاده موسی
|
منبع
|
انديشه آماري - 1398 - دوره : 24 - شماره : 1 - صفحه:117 -128
|
چکیده
|
یکی از معروف ترین رویکردهای اکتشافی برای کاهش بُعد و توصیف ساده تر منابع اصلی تغییرات، تحلیل مولفه های اصلی است. با وجود مزایای جالب توجه این روش، به کارگیری آن در برخی از مواقع مشکلاتی را به همراه دارد. حضور نقاط دوراُفتاده در مجموعه داده ها، تاثیرهای مخربی بر نتایج این رویکرد دارد که به نظر می رسد گونه ای از مولفه های اصلی که اُستوار باشند برای اخذ نتایج معتبر، سودمند است. به علاوه، وجود بارهای میانی در برخی از ترکیبات خطی، تفسیر مولفه ها را دشوار می سازد که در این حالت می توان گونه ای از تُنُک سازی مولفه ها را در نظر گرفت. در این مقاله، برای حصول هم زمان مولفه های اصلی اُستوار و تُنُک، رویکرد ترکیبی کارآمدی ارائه و سپس به منظور ارزیابی و مقایسه آن با رویکردهای مطرح شده از شبیه سازی آماری بهره گرفته می شود. در نهایت، ابزارهای مورد اشاره در تحلیل مثال واقعی مرتبط با مجموعه داده های جرم و جنایت در آمریکا مورد استفاده قرار می گیرد.
|
کلیدواژه
|
تحلیل مولفههای اصلی، نقاط دوراُفتاده، تعبیرپذیری مولفهها، تحلیل مولفههای اصلی اُستوار و تُنُک، دادههای جرم و جنایت
|
آدرس
|
دانشگاه تربیت مدرس, ایران, دانشگاه تربیت مدرس, گروه آمار, ایران
|
|
|
|
|
|
|
|
|
|
|
Sparsity of Principal Component Analysis on Presence of Outliers
|
|
|
Authors
|
Razaghi Amir ,Golalizadeh Mousa
|
Abstract
|
The Principal Components Analysis is one of the popular exploratory approaches to reduce the dimension and to describe the main source of variation among data . Despite many benefits , it is encountered with some problems in multivariate analysis . Having outliers among data significantly influences the results of this method and it sounds a robust version of PCA is beneficial in this case . In addition , having moderate loadings in the final results makes the interpretation of principal components rather difficult . One can consider a version of sparse components in this case . We study a hybrid approach consisting of joint robust and sparse components and conduct some simulations to evaluate and compare it with other traditional methods . The proposed technique is implemented in a reallife example dealing with the crime rate in the USA .
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|