عنوان پایان‌نامه

تشخیص هم تافت ها در شبکه های تعامل پروتئین - پروتئین با استفاده از ترکیب اطلاعات توالی و تکاملی



    دانشجو در تاریخ ۱۴ شهریور ۱۳۹۵ ، به راهنمایی ، پایان نامه با عنوان "تشخیص هم تافت ها در شبکه های تعامل پروتئین - پروتئین با استفاده از ترکیب اطلاعات توالی و تکاملی" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 3153;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 80249;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 3153;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 80249
    تاریخ دفاع
    ۱۴ شهریور ۱۳۹۵
    دانشجو
    اسما ایوازه
    استاد راهنما
    مسعود رهگذر

    پروتئین‌ها یکی از انواع درشت مولکول‌های زیستی هستند که از زیرواحدهایی به نام اسیدآمینه ساخته شده‌اند. پروتئین‌ها اعمال زیستی خود را به صورت گروهی و در تعامل با یکدیگر انجام می‌دهند، بنابراین از منظرهای مختلف، می‌توان پروتئین‌ها را در گروه‌های متفاوتی نظیر مسیر ، واحد عملکردی و هم‌تافت‌های پروتئینی قرار داد. تشخیص هم‌تافت‌های پروتئینی می‌تواند به فهم بهتر عملکرد سلول‌ها کمک کند و برای اهداف درمانی مثل کشف دارو مورد استفاده قرار گیرد. در این پژوهش، هدف یافتن هم‌تافت‌های پروتئینی از شبکه‌های برهم‌کنش پروتئین-پروتئین می‌باشد. در روش‌های محاسباتی، هم‌تافت‌ها را معمولا با اعمال الگوریتم‌های خوشه‌بندی روی شبکه برهم‌کنش پروتئین-پروتئین بدست می‌آورند. الگوریتم‌های خوشه‌بندی پیشنهاد شده، یا به تنهایی از ساختار شبکه برهم‌کنش پروتئینی و یا از ترکیب ساختار شبکه و اطلاعات زیستی، جهت تشخیص هم‌تافت‌های پروتئینی استفاده می‌کنند. همه‌ی این الگوریتم‌ها به عنوان ورودی، شبکه‌ای از برهم‌کنش‌های پروتئین-پروتئین دریافت می‌کنند، این در حالی است که قابلیت اطمینان داده‌های مربوط به این برهم‌کنش‌ها که از روش‌های با گذردهی بالا استخراج می‌شوند، کم است. در این پژوهش، دو روش برای یافتن هم‌تافت‌های پروتئینی ارائه شده است. در روش اول، با استفاده از اطلاعات تکاملی بین پروتئین‌ها در میان گونه‌های مختلف، سعی در ایجاد شبکه‌های برهم‌کنش پروتئین-پروتئین شده و از این شبکه جدید به عنوان ورودی الگوریتم‌های متفاوت استفاده می‌شود. در روش دوم، با استفاده از ترکیب خروجی الگوریتم‌های خوشه‌بندی و امتیاز دادن به هم‌تافت‌ها براساس اطلاعات بافت پروتئین‌های شرکت کننده در آنها، سعی در تشخیص هم‌تافت‌های پروتئینی شده است. نتایج آزمایش‌ها روی گونه‌های مختلف نشان می‌دهند که استفاده از شبکه‌ی جدید به عنوان ورودی الگوریتم‌های پیش‌بینی هم‌تافت‌های پروتئینی منجربه نتایج به‌مراتب بهتری خواهد شد. همچنین روش ترکیب خروجی الگوریتم‌ها و امتیاز دادن به هم‌تافت‌ها براساس اطلاعات بافت پروتئینی، باعث افزایش کارایی در تشخیص هم‌تافت‌ها می‌شود. هر دو روش ارائه شده، دقت معیارهای ارزیابی در زمینه‌ی تشخیص هم‌تافت‌های پروتئینی را افزایش می‌دهند. همچنین با توجه به وجود معیارهای متنوع ارزیابی عملکرد روش‌های پیش‌بینی هم‌تافت‌های پروتئینی، به تجزیه و تحلیل معیارهای متفاوت ارزیابی پرداخته شده است. نتایج بدست آمده تائید کننده این واقعیت است که استفاده نادرست از معیارهای ارزیابی می‌تواند منجر به بیش‌از‌حد برآورد نمودن کارایی یک روش پیش‌بینی هم‌تافت‌های پروتئین گردد. همچنین ابزاری به نام CompEvaluator با هدف جمع‌آوری و پیاده‌سازی معیارهای ارزیابی پیشنهاد شده در مقالات مختلف توسعه داده شده است. کلمات کلیدی: شبکه برهم‌کنش پروتئین-پروتئین، هم‌تافت‌های پروتئینی، معیارهای ارزیابی
    Abstract
    Proteins are types of biological macromolecular that are constructed from Amino acid components. Proteins do their biological functionalities by interacting together in groups. Therefore from different aspects proteins can be divided into groups based on their Pathway, Functional module and Protein complex. Detection of protein complexes can be helpful to better understand cells functionalities and treatment purposes like drug discovery. This research aims to detect protein complexes from protein-protein interaction networks (PPI). In computational methods, protein complexes are detected by using clustering algorithm on Protein-Protein interaction network. The proposed clustering algorithms, use solely protein interaction network topology or combine them with biological information to detect protein complexes. All these algorithms take a protein-protein interaction network as an input while reliability of these interaction data that are gathered from high-throughput experiment are not satisfiable. In this research, two methods are proposed to detect protein complexes. In the first method, by using evolutionary information between interspecies proteins, we generate protein-protein interaction network and use this network as input of different clustering algorithms. In the second method, protein complex detection is done by combining the output of different clustering algorithms and scoring detected protein complexes according to Protein tissue information. The experimental result on different species indicate that using the proposed network as an input of clustering algorithms leads to better protein complex detection. Also combination of different clustering algorithms output and scoring protein complex based on protein tissue information improves the performance of protein complex detection. Having different performance assessment measures for comparing protein complex detection algorithms, we also studied these measures. Our studies show that inappropriate use of performance assessment measures misevaluate performance of protein complex detection algorithms. We also developed a tool named CompEvaluator which aims to calculate different performance assessment measures proposed by previous researches. Keywords: Protein-Protein interaction network (PPI), Protein complex, Performance assessment measures