برآورد استوار در رگرسیون خطی در حضور هم خطی چندگانه و مدلهای تنک
- رشته تحصیلی
- آمار ریاضی
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس علوم شماره ثبت: 5929;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 73538;کتابخانه پردیس علوم شماره ثبت: 5929;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 73538
- تاریخ دفاع
- ۲۸ بهمن ۱۳۹۴
- دانشجو
- سارا جذن
- استاد راهنما
- سیدمرتضی امینی
- چکیده
- یکی از عوامل تأثیرگذار در تحلیل آماری دادهها، وجود مشاهدات دورافتاده است. به روشهایی که تحت تأثیر مشاهدات دورافتاده قرار نمیگیرند، روشهای آماری استوار گفته میشود. روشهای رگرسیونی استوار روشهای برآورد استوار پارامترهای مدل رگرسیونی در مقابل مشاهدات دورافتاده هستند. علاوه بر وجود مشاهدات دورافتاده، وجود وابستگی خطی میان متغیرهای پیشگو، که از آن با عنوان همخطی چندگانه یاد میشود و نیز تعداد زیاد متغیرها در مقابل حجم کم نمونه، به خصوص در مدلهای تُنک با بعد بالا، از دیگر مشکلاتی هستند که منجر به کاهش کارایی استنباطهای حاصل از روشهای کلاسیک رگرسیونی میشوند. در این پایاننامه، ابتدا معایب روش رگرسیونی کلاسیک کمترین توانهای دوم در مقابل مشاهدات دورافتاده، همخطی چندگانه و مدلهای تنک با بعد بالا را بررسی میکنیم. سپس به معرفی و بررسی روشهای رگرسیون استوار و رگرسیون تاوانیده به عنوان راهکارهای حل این مشکلات میپردازیم. همچنین با در نظر گرفتن مشاهدات دورافتاده و همخطی چندگانه و یا مدلهای تنک به طور همزمان به بررسی روشهای رگرسیون استوار تاوانیده میپردازیم.
- Abstract
- One of the factors affecting the statistical analysis of the data is the presence of outliers. The methods which are not affected by the outliers are called robust methods. Robust regression methods are robust estimation methods of regression model parameters in the presence of outliers. Besides outliers, the linear depence of regressor variables, which is called multicollinearity, the large number of regressor variables with respect to sample size, specially in high dimensional sparse models, are problems which result in efficiency reduction of inferences in classical regression methods.In this dissertation, we first study the disadvantages of classical least squares regression method, when facing with outliers, multicollinearity and high dimensional sparse models. Then, we introduce and study robust and penalized regression methods, as a solution to overcome these problems. Furthermore, considering outliers and multicollinearity or sparse models, simultaneously, we study penalized-robust regression methods.Key words: Outliers; Robust regression; Multicollinearity; Sparse model; Least squares method; Penalized regression