عنوان مقاله :
مدلهاي رگرسيوني براي تحليل دادههاي چوله دو مدي
عنوان به زبان ديگر :
Regression Models for Analyzing Skewed Bimodal Data
پديد آورندگان :
جعفري خالدي، مجيد دانشگاه تربيت مدرس - دانشكده علوم رياضي -گروه آمار، ايران , ميرزاوند، حسن دانشگاه تربيت مدرس - دانشكده علوم رياضي -گروه آمار، ايران
كليدواژه :
چولگي , توزيعهاي دو مدي , تقارن , توزيعهاي آميخته , رگرسيون
چكيده فارسي :
براي استنباط آماري در مورد پارامترهاي مدل رگرسيوني نياز به فرض توزيع مشخصي بر روي عبارت خطاي تصادفي ميباشد. يك فرض اساسي در مدل رگرسيون خطي اين است كه عبارت خطاي تصادفي از يك توزيع نرمال پيروي كند. با اين حال، در پژوهشهاي آماري گاهي با دادههايي مواجه ميشويم كه توزيع آنها چولگي و دو مدي را ارائه ميدهند، و ديگر نميتوان از فرض توزيع نرمال براي تحليل آنها استفاده كرد. يك رويكرد مرسوم براي حل اين مسئله به كارگيري آميختهاي از مدلهاي چوله نرمال است. اما در اين گونه مدلها تعداد پارامترها به نحو فزايندهاي افزايش مييابد كه اين خود برازش مدلها به دادهها را دشوار مينمايد. بعلاوه مدلهاي آميخته خود درگير مسائلي مانند شناساناپذيري هستند.
در اين حالت يك راهحل مناسب استفاده از توزيعهاي منعطفي است، كه بتوانند چولگي و دو مدي بودن دادهها را در مدل بندي لحاظ كنند. تاكنون روشهاي مختلفي ارائه شده كه بر مبناي توسعه توزيع چولهنرمال، توزيعهاي دو مدي نامتقارن ايجاد شدهاند. در اين مقاله از اين روشها براي ساخت و معرفي مدل رگرسيوني منعطف نسبت به مدلهاي رگرسيون مبتني بر توزيع چولهنرمال و آميختهاي از دو توزيع چولهنرمال استفاده شده و با بكارگيري مثال شبيه سازي عملكرد آنها مورد بررسي قرار ميگيرد. سپس نحوه كاربست آنها در يك مثال كاربردي مربوط به مجموعه دادههاي اسب دواني نشان داده ميشود.
چكيده لاتين :
To make statistical inferences about regression model parameters, it is necessary to assume a specific distribution on the random error expression. A basic assumption in a linear regression model is that the random error expression follows a normal distribution. However, in some statistical researches, data simultaneously display skewness and bimodality features. In this setting, the normality assumption is violated. A common approach to avoiding this problem is to use a mixture of skew-normal distributions. But such models involve many parameters, which it makes difficult to fit the models to the data. Moreover, these models are faced with the non-identifiability issue.
In this situation, a suitable solution is to use flexible distributions, which can take into account the skewness and bimodality observed in the data distribution. In this direction, various methods have been proposed based on developing of the skew-normal distribution in recent years. In this paper, these methods are used to introduce more flexible regression models than the regression models based on skew-normal distribution and a mixture of two skew-normal distributions. Their performance is compared using a simulation example. The methodology is then illustrated in a practical example related to a horses dataset.
عنوان نشريه :
انديشه آماري