|
|
روش های تحلیل رگرسیونی برای داده های بعد بالا
|
|
|
|
|
نویسنده
|
معنوی منیره ,روزبه مهدی
|
منبع
|
انديشه آماري - 1399 - دوره : 25 - شماره : 1 - صفحه:69 -90
|
چکیده
|
با پیشرفت علم، دانش و تکنولوژی، روش های جدید و جامع برای اندازه گیری، جمع آوری و ثبت اطلاعات ابداع شده اند، که منجر به ظهور وتوسعه داده های بعد بالا شده اند. مجموعه داده های بعد بالا، یعنی مجموعه داده هایی که در آن تعداد متغیرهای توضیحی بسیار بزرگتر از تعدادمشاهدات است، به سادگی و با روش های سنتی و کلاسیک، مانند روش کمترین توان های دوم معمولی، نمی توانند تحلیل شوند و تفسیرپذیری آنامری بسیار پیچیده خواهد بود. اگرچه در صورتیکه فرضیات اساسی برقرار باشند، برآورد کمترین توان های دوم معمولی بهترین روش برآورد درتحلیل رگرسیونی است ولی برای داده های بعد بالا قابل استفاده نبوده و در این شرایط مستلزم به کارگیری روش هایی نوینی هستیم. در این مقاله درابتدا، به مشکلات روش های کلاسیک در تحلیل داده های بعد بالا اشاره می شود و سپس، به معرفی و توضیح روش های تحلیل رگرسیونی متداولو امروزی مانند روش های تحلیل مولفه اصلی و تاوانیده برای داده های بعد بالا پرداخته می شود. در انتها یک مطالعه شبیه سازی برای بررسی ومقایسه روش های اشاره شده در داده های بعد بالا انجام می گردد.
|
کلیدواژه
|
تحلیل مولفه های اصلی، مجموعه داده های بعد بالا، روش کمترین توان های دوم تاوانیده.
|
آدرس
|
دانشگاه سمنان, ایران, دانشگاه سمنان, گروه آمار, ایران
|
پست الکترونیکی
|
mahdi.roozbeh@semnan.ac.ir
|
|
|
|
|
|
|
|
|
Regression Analysis Methods for High-dimensional Data
|
|
|
Authors
|
Maanavi Monireh ,Roozbeh Mahdi
|
Abstract
|
By evolving science, knowledge, and technology, new and precise methods for measuring, collecting, and recording information have been innovated, which have resulted in the appearance and development of highdimensional data. The highdimensional data set, i.e., a data set in which the number of explanatory variables is much larger than the number of observations, cannot be easily analyzed by traditional and classical methods, the same as the ordinary leastsquares method, and its interpretability will be very complex. Although in classical regression analysis, the ordinary leastsquares estimation is the best estimation method if the essential assumptions are met, it is not applicable for highdimensional data, and in this condition, we need to apply the modern methods. In this research, it is first mentioned the drawbacks of classical methods in the analysis of highdimensional data and then, it is proceeded to introduce and explain the modern and common approaches of the regression analysis for highdimensional data same as principal component analysis and penalized methods. Finally, a simulation study and realworld data analysis are performed to apply and compare the mentioned methods in highdimensional data.
|
Keywords
|
High-dimensional data set ,Penalized least-squares method ,Principle component Analysis.
|
|
|
|
|
|
|
|
|
|
|