|
|
مدل های رگرسیونی برای تحلیل داده های چوله دو مدی
|
|
|
|
|
نویسنده
|
میرزاوند حسن ,جعفری خالدی مجید
|
منبع
|
انديشه آماري - 1400 - دوره : 26 - شماره : 2 - صفحه:89 -103
|
چکیده
|
برای استنباط آماری در مورد پارامترهای مدل رگرسیونی نیاز به فرض توزیع مشخصی بر روی عبارت خطای تصادفی میباشد. یک فرض اساسی در مدل رگرسیون خطی این است که عبارت خطای تصادفی از یک توزیع نرمال پیروی کند. با این حال، در پژوهشهای آماری گاهی با دادههایی مواجه میشویم که توزیع آنها چولگی و دو مدی را ارائه میدهند، و دیگر نمیتوان از فرض توزیع نرمال برای تحلیل آنها استفاده کرد. یک رویکرد مرسوم برای حل این مسئله به کارگیری آمیختهای از مدلهای چوله نرمال است. اما در این گونه مدلها تعداد پارامترها به نحو فزایندهای افزایش مییابد که این خود برازش مدل ها به دادهها را دشوار مینماید. بعلاوه مدلهای آمیخته خود درگیر مسائلی مانند شناساناپذیری هستند. در این حالت یک راهحل مناسب استفاده از توزیعهای منعطفی است، که بتوانند چولگی و دو مدی بودن دادهها را در مدل بندی لحاظ کنند. تاکنون روشهای مختلفی ارائه شده که بر مبنای توسعه توزیع چولهنرمال، توزیعهای دو مدی نامتقارن ایجاد شدهاند. در این مقاله از این روشها برای ساخت و معرفی مدل رگرسیونی منعطف نسبت به مدلهای رگرسیون مبتنی بر توزیع چولهنرمال و آمیختهای از دو توزیع چولهنرمال استفاده شده و با به کارگیری مثال شبیه سازی عملکرد آنها مورد بررسی قرار میگیرد. سپس نحوه کاربست آنها در یک مثال کاربردی مربوط به مجموعه دادههای اسب دوانی نشان داده میشود.
|
کلیدواژه
|
چولگی، توزیعهای دو مدی، تقارن، توزیعهای آمیخته، رگرسیون
|
آدرس
|
دانشگاه تربیت مدرس, دانشکده علوم ریاضی, گروه آمار, ایران, دانشگاه تربیت مدرس, دانشکده علوم ریاضی, گروه آمار, ایران
|
پست الکترونیکی
|
jafari-m@modares.ac.ir
|
|
|
|
|
|
|
|
|
Regression Models for Analyzing of Bimodal and Skewed Data
|
|
|
Authors
|
Mirzavand Hassan ,Jafari Khaledi Majid
|
Abstract
|
To make statistical inferences about regression model parameters, it is necessary to assume a specific distribution on the random error expression. A basic assumption in a linear regression model is that the random error expression follows a normal distribution. However, in some statistical researches, data simultaneously display skewness and bimodality features. In this setting, the normality assumption is violated. A common approach to avoiding this problem is to use a mixture of skewnormal distributions. But such models involve many parameters, which it makes difficult to fit the models to the data. Moreover, these models are faced with the nonidentifiability issue.In this situation, a suitable solution is to use flexible distributions, which can take into account the skewness and bimodality observed in the data distribution. In this direction, various methods have been proposed based on developing of the skewnormal distribution in recent years. In this paper, these methods are used to introduce more flexible regression models than the regression models based on skewnormal distribution and a mixture of two skewnormal distributions. Their performance is compared using a simulation example. The methodology is then illustrated in a practical example related to a horses dataset.
|
Keywords
|
Skewness ,Symmetry ,Bimodal distributions ,Mixed distributions ,Regression
|
|
|
|
|
|
|
|
|
|
|