عنوان پایاننامه
تشخیص زیر شبکه های نشان گر بیماری در شبکه های بر همکنش پروتئین
- رشته تحصیلی
- مهندسی کامپیوتر -نرم افزار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2826;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71417
- تاریخ دفاع
- ۱۵ شهریور ۱۳۹۴
- دانشجو
- احسان حیدری
- استاد راهنما
- مسعود رهگذر, کاوه کاوسی
- چکیده
- در گذشته بسیاری از مطالعات به منظور تشخیص بیماری، تلاش میکردند با استفاده از دادههای ریزآرایه، به یافتن ژنهای دارای بیشترین میزان تغییر بیان ژنی بپردازند. اما با توجه به اینکه این ژنها در مجموعه دادههای دیگر پایا نیستند، امروزه روشهای جدیدتری به وجود آمده است که در آنها سعی میشود از اطلاعات موجود در شبکههای ژنی نیز استفاده شود. این روشها ادعا میکنند با اضافه کردن اطلاعات شبکههای موجود به دادههای بیان ژنی میتوان به نشانگرهای پایاتری دست یافت. اما با بررسی اینگونه روشها نیز کاستیهایی مشاهده میشود از جمله این که ممکن است برخی از ژنهایی که میتوانند در تشخیص بیماری نقش مهمی ایفا کنند، در این روشها پنهان بمانند. این امر موجب میشود تا دقت نتایج بدست آمده به اندازه کافی بالا نباشد. برای غلبه بر این مشکل، در این پژوهش روش مبتنی بر شبکه دیگری ارائه شده است که در آن پس از ارزشگذاری ژنها بر اساس میزان تغییر در بیانشان، با بهرهگیری از دادههای بیان ژنی و شبکه برهمکنش پروتئین-پروتئین به رتبهبندی مجدد ژنها با استفاده از روشی مشابه روش pagerank گوگل پرداخته میشود. پس از آن با برگزیدن چند ژن منتخب، زیرشبکههایی متشکل از هر یک از این چند ژن و ژنهایی که در شبکه به آنها خیلی نزدیک و با آنها بسیار همبیان هستند، حاصل شده است. در پایان ویژگیهایی به منظور طبقهبندی، از روی این زیرشبکهها بدست آمده است. الگوریتم ارائه شده روی چهار نوع سرطان از 9 مجموعه داده مختلف تست شده است و مشاهده شده که در روش ما ژنهایی (و زیرشبکههایی) برای تشخیص بیماری بکار گرفته میشوند که نسبت به روشهای پیشین میتواند نتایج بهبود یافتهتری را به ما ارائه دهد. واژههای کلیدی: شبکه برهمکنش پروتئین-پروتئین، بیان ژنی، زیرشبکه، نشانگر
- Abstract
- In the past, many people tried to find most differentially expressed genes, using micro-array data, with the objective of detecting disease. However, because these gene are not reproducible in other datasets, nowadays newer methods were introduced that try to use the information in gene networks. They claim combining gene network data with gene expression data will conclude more reproducible biomarkers. But some defects exist even in these approaches, including neglecting some genes that may have important role in disease detection. It cause low accuracy in prediction. To tackle the problem, we have introduced a sub-network based approach, in which after rating genes based on their differential expression, we re-rank genes using gene expression and protein-protein network data, with a method like google pagerank. Then, we constructed a number of sub-network containing selected genes and the genes that are co-expressed and closely connected to them in the PPI sub-network. Finally, a number of features is obtained to classify samples. The proposed algorithm was tested on 4 cancer type from 9 different datasets, and we found that this method offers genes (and sub-networks) that result more accurate predictions in comparison to other methods. Keywords: Protein-Protein interaction network, gene expression data