|
|
مدلهای نیمهپارامتری استوار تنک با بعد بالا
|
|
|
|
|
نویسنده
|
روزبه مهدی ,معنوی منیره
|
منبع
|
انديشه آماري - 1401 - دوره : 27 - شماره : 1 - صفحه:19 -31
|
چکیده
|
تحلیل و مدلبندی دادههای با بعد بالا یکی از چالش برانگیزترین مسائل روز دنیا است. تفسیر این دادهها کاری ساده نیست و نیازمند استفاده از روشهای مدرن است. روشهای جریمهای یکی از مشهورترین راههای تحلیل دادههای با بعد بالاست. همچنین مدلبندی رگرسیونی و تحلیل آن بهشدت تحت تاثیر مشاهدات پرت قرار میگیرد. روش کمترین توانهای دوم پیراسته نیز یکی از بهترین روشهای استوار برای از بین بردن تاثیر تخریبی این نقاط است. مدلهای نیمهپارامتری که مدلهایی بسیار انعطافپذیرند، ترکیبی از هر دو نوع مدلهای پارامتری و ناپارامتری هستند. این مدلها زمانیکه هم بخش پارامتری و هم بخش ناپارامتری در مدل وجود دارد، مفیدند. هدف اصلی این مقاله تحلیل مدلهای نیمه پارامتری در دادههای با بعد بالا با حضور نقاط پرت با استفاده از روش لاسو تنک استوار است. در انتها، کارایی برآوردگر پیشنهادی با استفاده از یک داده واقعی در مورد تولید ویتامین b2 سنجیده میشود.
|
کلیدواژه
|
روش کمترین توانهای دوم پیراسته، روش لاسو، دادههای با بعد بالا، روش کمترین توانهای دوم پیراسته تنک، مدل های نیمه پارامتری
|
آدرس
|
دانشگاه سمنان, گروه آمار, ایران, دانشگاه سمنان, ایران
|
|
|
|
|
|
|
|
|
|
|
sparse robust semiparametric models in high-dimensional data
|
|
|
Authors
|
roozbeh mahdi ,maanavi monireh
|
Abstract
|
analysis and modeling the high-dimensional data is one of the most challenging problems faced by the world nowaday. interpretation of such data is not easy and needs to be applied to modern methods. the penalized methods are one of the most popular ways to analyze the high-dimensional data. also, the regression models and their analysis are affected by the outliers seriously. the least trimmed squares method is one of the best robust approaches to solve the corruptive influence of the outliers. semiparametric models, which are a combination of both parametric and nonparametric models, are very flexible models. they are useful when the model contains both parametric and nonparametric parts. the main purpose of this paper is to analyze semiparametric models in high-dimensional data with the presence of outliers using the robust sparse lasso approach. finally, the performance of the proposed estimator is examined using a real data analysis about production of vitamin b2.
|
Keywords
|
high-dimensional data، lasso method، least timmed squares method، semiparametric model، sparse least trimmed squares method
|
|
|
|
|
|
|
|
|
|
|