|
|
|
|
تشخیص مشاهدات موثر برای رگرسیون بعد بالا
|
|
|
|
|
|
|
|
نویسنده
|
نوری نسرین ,بیورانی حسین
|
|
منبع
|
علوم آماري - 1402 - دوره : 17 - شماره : 2 - صفحه:349 -369
|
|
چکیده
|
استفاده از روشهای درستنمایی تاوانیده با تکثیر مجموعه دادههای بعد بالا گسترش یافته است. با این وجود، هنگامی که تعداد مشاهدات در مقایسه با تعداد متغیرهای کمکی نسبتاً کم است، هر مشاهدهای بهطور بالقوه میتواند تاثیر بسزایی روی انتخاب مدل و استنباط داشته باشد. بنابراین، شناسایی و ارزیابی مشاهدات موثر در روشهای تاوانیده مهم است. در این مقاله، معیارهای تاثیر برای تشخیص مشاهدات موثر در رگرسیون لاسو بعد بالا که اخیراً معرفی شدهاند، مرور میشوند. سپس، این معیارها تحت روش الاستیکنت که برای بهبود پیشبینیهای مدل، ویژگی حذف از لاسو و کاهش ضرایب از ریج را ترکیب کرده، بررسی میشوند. از طریق شبیهسازی و مجموعه دادههای واقعی نشان داده میشود که معیارهای تاثیر معرفی شده بهطور کارآمد مشاهدات موثر را شناسایی میکنند و میتوانند به آشکارسازی روابط پنهان در دادهها کمک کنند.
|
|
کلیدواژه
|
مباحث تشخیصی تاثیر، مشاهدات موثر، دادههای بعد بالا، روشهای تاوانیده
|
|
آدرس
|
دانشگاه تبریز, دانشکده ریاضی، آمار و علوم کامپیوتر, گروه آمار, ایران, دانشگاه تبریز, دانشکده ریاضی، آمار و علوم کامپیوتر, گروه آمار, ایران
|
|
پست الکترونیکی
|
bevrani@gmail.com
|
|
|
|
|
|
|
|
|
|
|
|
|
identification of influential observations for high-dimensional regression
|
|
|
|
|
Authors
|
noori nasrin ,bevrani hossein
|
|
Abstract
|
the prevalence of high-dimensional datasets has driven increased utilization of the penalized likelihood methods. however، when the number of observations is relatively few compared to the number of covariates، each observation can tremendously influence model selection and inference. therefore، identifying and assessing influential observations is vital in penalized methods. this article reviews measures of influence for detecting influential observations in high-dimensional lasso regression and has recently been introduced. then، these measures under the elastic net method، which combines removing from lasso and reducing the ridge coefficients to improve the model predictions، are investigated. through simulation and real datasets، illustrate that introduced influence measures effectively identify influential observations and can help reveal otherwise hidden relationships in the data.
|
|
Keywords
|
influence diagnostics ,influential observations ,high-dimensionaldata ,penalized methods
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|