مدل های رگرسیونی برای تحلیل داده های چوله دو مدی

Fa | Ar | En

مدل های رگرسیونی برای تحلیل داده های چوله دو مدی


نویسنده	میرزاوند حسن ,جعفری خالدی مجید
منبع	انديشه آماري - 1400 - دوره : 26 - شماره : 2 - صفحه:89 -103
چکیده	برای استنباط آماری در مورد پارامتر‌های مدل رگرسیونی نیاز به فرض توزیع مشخصی بر روی عبارت خطای تصادفی می‌باشد. یک فرض اساسی در مدل رگرسیون خطی این است که عبارت خطای تصادفی از یک توزیع نرمال پیروی کند. با این حال، در پژوهش‌های آماری گاهی با داده‌هایی مواجه می‌شویم که توزیع آن‌ها چولگی و دو مدی را ارائه می‌دهند، و دیگر نمی‌توان از فرض توزیع نرمال برای تحلیل آنها استفاده کرد. یک رویکرد مرسوم برای حل این مسئله به کارگیری آمیخته‌ای از مدل‌های چوله نرمال است. اما در این گونه مدل‌ها تعداد پارامترها به نحو فزاینده‌ای افزایش می‌یابد که این خود برازش مدل ها به داده‌ها را دشوار می‌نماید. بعلاوه مدل‌های آمیخته خود درگیر مسائلی مانند شناساناپذیری هستند. در این حالت یک راه‌حل مناسب استفاده از توزیع‌های منعطفی است، که بتوانند چولگی و دو مدی بودن داده‌ها را در مدل بندی لحاظ کنند. تاکنون روشهای مختلفی ارائه شده که بر مبنای توسعه توزیع چوله‌نرمال، توزیع‌های دو مدی نامتقارن ایجاد شده‌اند. در این مقاله از این روشها برای ساخت و معرفی مدل رگرسیونی منعطف نسبت به مدل‌های رگرسیون مبتنی بر توزیع چوله‌نرمال و آمیخته‌ای از دو توزیع چوله‌نرمال استفاده شده و با به کارگیری مثال شبیه سازی عملکرد آنها مورد بررسی قرار می‌گیرد. سپس نحوه کاربست آنها در یک مثال کاربردی مربوط به مجموعه داده‌های اسب دوانی نشان داده می‌شود.
کلیدواژه	چولگی‌، توزیع‌های دو مدی، تقارن، توزیع‌های آمیخته، رگرسیون
آدرس	دانشگاه تربیت مدرس, دانشکده علوم ریاضی, گروه آمار, ایران, دانشگاه تربیت مدرس, دانشکده علوم ریاضی, گروه آمار, ایران
پست الکترونیکی	jafari-m@modares.ac.ir

Regression Models for Analyzing of Bimodal and Skewed Data

Authors	Mirzavand Hassan ,Jafari Khaledi Majid
Abstract	To make statistical inferences about regression model parameters, it is necessary to assume a specific distribution on the random error expression. A basic assumption in a linear regression model is that the random error expression follows a normal distribution. However, in some statistical researches, data simultaneously display skewness and bimodality features. In this setting, the normality assumption is violated. A common approach to avoiding this problem is to use a mixture of skewnormal distributions. But such models involve many parameters, which it makes difficult to fit the models to the data. Moreover, these models are faced with the nonidentifiability issue.In this situation, a suitable solution is to use flexible distributions, which can take into account the skewness and bimodality observed in the data distribution. In this direction, various methods have been proposed based on developing of the skewnormal distribution in recent years. In this paper, these methods are used to introduce more flexible regression models than the regression models based on skewnormal distribution and a mixture of two skewnormal distributions. Their performance is compared using a simulation example. The methodology is then illustrated in a practical example related to a horses dataset.
Keywords	Skewness ,Symmetry ,Bimodal distributions ,Mixed distributions ,Regression