شناسایی ژن های موثر برپیشرفت تومر از داده های ریز آرایه به وسیله روش بیز تجربی
- رشته تحصیلی
- آمار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس علوم شماره ثبت: 5864;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71987
- تاریخ دفاع
- ۳۰ شهریور ۱۳۹۴
- دانشجو
- پویان نژادی
- چکیده
- امروزه به لطف پیشرفت تکنولوژی، استفاده از دادههای با بعد بالا، کاملا عادی به نظر میرسد و حوزههای مختلف علوم از روش های آماری فراهم شده، بهره میبرند. بنابراین با توجه به افزایش ویژگیهای اندازهگیری شده در این مجموعه دادهها، شاهد افزایش آزمونهای فرض خواهیم بود. این آزمونها زمانی بهترین نتیجه خود را خواهند داشت که به طور همزمان مورد بررسی قرار گیرند. روشهای مختلفی از جمله کنترل نرخ اکتشاف کاذب برای انجام این کار ارائه شده است که به آزمون فرض های چندگانه معروف میباشند. در این پایان نامه از دادههای ریزآرایه، استفاده میشود که از ویژگیهای آن به ابعاد بالای آن میتوان اشاره نمود. لذا به دلیل بالا بودن بعد مجموعه داده در نظر گرفته شده، از برآوردگرهای انقباضی جهت دستیابی به برآوردهای بهینه استفاده میشود. امروزه استفاده از ریزآرایهها و دادههای استخراج شده از آن، در علوم پزشکی و آزمایشگاهی به امری کاملاً عادی تبدیل شده است، که با کمک این اطلاعات میتوان فهمید بیان کدامیک از ژنها، با پیشرفت بیماری همبستگی دارد
- Abstract
- Recently, due to development of technology, the use high dimensional data is quite common and several areas of sciences benifited from the provided stattistical techniqes . Specially, we have seen an increase in number of hypothesis testing with respect to increased features in the dataset. When these tests are to be considered simultaneously, which is known as multiple testing they will have the best performance. Several methods, such as controlling the false discovery rate are considered for this issue. In this thesis, we used data that generated from microarrays in which the dimension of this dataset is high. Due to its nature, these sort of datasets are high-dimensional and we use shrinkage estimators to obtain optimal estimators. The use of microarray data has become quite commonplace in medical and scientific experiments. It is potentially important for the discovery of biomarkers to identify genes whose expression levels correlate with tumor progression Keywords:Multiple-Testing, Gene expression, Shrinkage estimators, q-value, Mixture models, Simultaneous inference, False discovery rate, Empirical Bayes