عنوان پایان‌نامه

به کارگیری خصوصیات پروتئین برای تشخیص هم تافت های کم تراکم در شبکه های پروتئین - پروتئین



    دانشجو در تاریخ ۲۹ شهریور ۱۳۹۴ ، به راهنمایی ، پایان نامه با عنوان "به کارگیری خصوصیات پروتئین برای تشخیص هم تافت های کم تراکم در شبکه های پروتئین - پروتئین" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2956;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75343;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2956;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75343
    تاریخ دفاع
    ۲۹ شهریور ۱۳۹۴

    پروتئین‌ها مواد آلی بزرگ و یکی از انواع درشت ملکول ‌های زیستی هستند که از زیرواحدهایی به نام اسید آمینه ساخته شده‌اند. پروتئین‌ها اعمال زیستی خود را به صورت گروهی و در تعامل با یکدیگر انجام می‌دهند. بنابراین از منظرهای متفاوت پروتئین‌ها در گروه‌های متفاوتی نظیر گذر ، واحد عمل‌کردی و هم‌تافت پروتئینی قرار می‌گیرند در این پژوهش به یافتن هم‌تافت‌های پروتئینی پرداخته شده است. در روش‌های محاسباتی هم‌تافت‌ها را معمولاً با اعمال الگوریتم‌های خوشه‌بندی بر شبکه تعاملات پروتئین-پروتئین به دست می‌آورند. اکثر روش‌های خوشه‌بندیِ موجود شرط تراکم خوشه را برای یافتن هم‌تافت‌های پروتئینی از شبکه‌ی تعاملات پروتئین-پروتئین در نظر می‌گیرند؛ در حالی که هم‌تافت‌های شناخته شده و موجود در مجموعه داده‌های استاندارد نشان می‌دهد که این فرض برای برخی از هم‌تافت‌ها صحت ندارد؛ یعنی هم‌تافت‌هایی وجود دارد که در شبکه‌ی تعاملاتِ موجود تراکم پایینی دارند و به همین دلیل توسط این روش‌ها قابل شناسایی نیستند. از این رو با هدف یافتن هم‌تافت‌های بیشتر، در این پژوهش، بر یافتن هم‌تافت‌های کم‌تراکم تمرکز شده است و الگوریتمی با نام SCD ارائه شده است. این الگوریتم با پردازش خوشه‌های حاصل از الگوریتم‌های خوشه‌بندی دیگر، کیفیت خوشه‌ها را بهبود بخشیده و باعث تشخیص هم‌تافت‌های بیشتری می‌شود. نتایج الگوریتم SCD بر روی شبکه تعاملات مخمر با سه مجموعه داده استاندارد طلایی مقایسه شده و در مقایسه با خوشه‌های اولیه و همچنین در مقایسه با الگوریتم SPARC که مشابه الگوریتم SCD عمل می‌کند، در هر سه آزمایش بهبود چشم‌گیری نشان داده است. واژه‌های کلیدی: هم‌تافت‌های پروتئینی، هم‌تافت کم‌تراکم، الگوریتم خوشه‌بندی، تشخیص هم‌تافت، تعاملات عمل‌کردی
    Abstract
    Proteins are among organic compounds and one of the biological macromolecules which are made from the sub units called Amino acid. Proteins interactively perform the biological actions together. Thus, in different standpoint, proteins are categorized in different groups like, pathway, functional module and complex. In this research, the mechanism for complex protein detection is developed. In computation methods, complex are detected by applying the clustering algorithm on protein-protein interaction network. Most of the already developed clustering methods considers the cluster density for protein complex detection from the protein-protein interaction network. However, all the known complex available at the benchmark dataset shows that this assumption is not right for some complex. This means that there are some complex with lower density in available interaction networks that are not detectable with these methods. Therefore, in this research, for detecting more number of complex, the main focused is on the lower density complex and an algorithm called “SCD” is proposed. In this algorithm by processing the clusters of other clustering algorithm, the clustering quality is getting better which results in detecting more number of complex. The results of applying SCD on yeast interaction network with three gold standard dataset are compared to the initial clusters and in comparison to SPARC Algorithm, which act like SCD algorithm, in all three experiment shows a significant improvement. Keywords: proteins complex, sparse complex, clustering algorithm, complex detection, functional interaction.