عنوان پایان‌نامه

تشخیص زیر شبکه های نشان گر بیماری در شبکه های بر همکنش پروتئین



    دانشجو در تاریخ ۱۵ شهریور ۱۳۹۴ ، به راهنمایی ، پایان نامه با عنوان "تشخیص زیر شبکه های نشان گر بیماری در شبکه های بر همکنش پروتئین" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2826;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71417
    تاریخ دفاع
    ۱۵ شهریور ۱۳۹۴
    دانشجو
    احسان حیدری
    استاد راهنما
    مسعود رهگذر, کاوه کاوسی

    در گذشته بسیاری از مطالعات به منظور تشخیص بیماری، تلاش می‌کردند با استفاده از داده‌های ریز‌آرایه، به یافتن ژن‌های دارای بیشترین میزان تغییر بیان ژنی بپردازند. اما با توجه به اینکه این ژن‌ها در مجموعه داده‌های دیگر پایا نیستند، امروزه روش‌های جدیدتری به وجود آمده است که در آن‌ها سعی می‌شود از اطلاعات موجود در شبکه‌های ژنی نیز استفاده شود. این روش‌ها ادعا می‌کنند با اضافه کردن اطلاعات شبکه‌های موجود به داده‌های بیان ژنی می‌توان به نشان‌گرهای پایاتری دست یافت. اما با بررسی اینگونه روش‌ها نیز کاستی‌هایی مشاهده می‌شود از جمله این که ممکن است برخی از ژن‌هایی که می‌توانند در تشخیص بیماری نقش مهمی ایفا کنند، در این روش‌ها پنهان بمانند. این امر موجب می‌شود تا دقت نتایج بدست آمده به اندازه کافی بالا نباشد. برای غلبه بر این مشکل، در این پژوهش روش مبتنی بر شبکه دیگری ارائه شده است که در آن پس از ارزش‌گذاری ژن‌ها بر اساس میزان تغییر در بیانشان، با بهره‌گیری از داده‌های بیان ژنی و شبکه برهمکنش پروتئین-پروتئین به رتبه‌بندی مجدد ژن‌ها با استفاده از روشی مشابه روش pagerank گوگل پرداخته می‌شود. پس از آن با برگزیدن چند ژن منتخب، زیرشبکه‌هایی متشکل از هر یک از این چند ژن و ژن‌هایی که در شبکه به آن‌ها خیلی نزدیک و با آن‌ها بسیار هم‌بیان هستند، حاصل شده است. در پایان ویژگی‌هایی به منظور طبقه‌بندی، از روی این زیرشبکه‌ها بدست آمده است. الگوریتم ارائه شده روی چهار نوع سرطان از 9 مجموعه داده مختلف تست شده است و مشاهده شده که در روش ما ژن‌هایی (و زیرشبکه‌هایی) برای تشخیص بیماری بکار گرفته می‌شوند که نسبت به روش‌های پیشین می‌تواند نتایج بهبود یافته‌تری را به ما ارائه دهد. واژه‌های کلیدی: شبکه برهمکنش پروتئین-پروتئین، بیان ژنی، زیرشبکه، نشان‌گر
    Abstract
    In the past, many people tried to find most differentially expressed genes, using micro-array data, with the objective of detecting disease. However, because these gene are not reproducible in other datasets, nowadays newer methods were introduced that try to use the information in gene networks. They claim combining gene network data with gene expression data will conclude more reproducible biomarkers. But some defects exist even in these approaches, including neglecting some genes that may have important role in disease detection. It cause low accuracy in prediction. To tackle the problem, we have introduced a sub-network based approach, in which after rating genes based on their differential expression, we re-rank genes using gene expression and protein-protein network data, with a method like google pagerank. Then, we constructed a number of sub-network containing selected genes and the genes that are co-expressed and closely connected to them in the PPI sub-network. Finally, a number of features is obtained to classify samples. The proposed algorithm was tested on 4 cancer type from 9 different datasets, and we found that this method offers genes (and sub-networks) that result more accurate predictions in comparison to other methods. Keywords: Protein-Protein interaction network, gene expression data