تشخیص هم تافت ها در شبکه های تعامل پروتئین - پروتئین با استفاده از ترکیب اطلاعات توالی و تکاملی
- رشته تحصیلی
- مهندسی کامپیوتر -نرم افزار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 3153;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 80249;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 3153;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 80249
- تاریخ دفاع
- ۱۴ شهریور ۱۳۹۵
- دانشجو
- اسما ایوازه
- استاد راهنما
- مسعود رهگذر
- چکیده
- پروتئینها یکی از انواع درشت مولکولهای زیستی هستند که از زیرواحدهایی به نام اسیدآمینه ساخته شدهاند. پروتئینها اعمال زیستی خود را به صورت گروهی و در تعامل با یکدیگر انجام میدهند، بنابراین از منظرهای مختلف، میتوان پروتئینها را در گروههای متفاوتی نظیر مسیر ، واحد عملکردی و همتافتهای پروتئینی قرار داد. تشخیص همتافتهای پروتئینی میتواند به فهم بهتر عملکرد سلولها کمک کند و برای اهداف درمانی مثل کشف دارو مورد استفاده قرار گیرد. در این پژوهش، هدف یافتن همتافتهای پروتئینی از شبکههای برهمکنش پروتئین-پروتئین میباشد. در روشهای محاسباتی، همتافتها را معمولا با اعمال الگوریتمهای خوشهبندی روی شبکه برهمکنش پروتئین-پروتئین بدست میآورند. الگوریتمهای خوشهبندی پیشنهاد شده، یا به تنهایی از ساختار شبکه برهمکنش پروتئینی و یا از ترکیب ساختار شبکه و اطلاعات زیستی، جهت تشخیص همتافتهای پروتئینی استفاده میکنند. همهی این الگوریتمها به عنوان ورودی، شبکهای از برهمکنشهای پروتئین-پروتئین دریافت میکنند، این در حالی است که قابلیت اطمینان دادههای مربوط به این برهمکنشها که از روشهای با گذردهی بالا استخراج میشوند، کم است. در این پژوهش، دو روش برای یافتن همتافتهای پروتئینی ارائه شده است. در روش اول، با استفاده از اطلاعات تکاملی بین پروتئینها در میان گونههای مختلف، سعی در ایجاد شبکههای برهمکنش پروتئین-پروتئین شده و از این شبکه جدید به عنوان ورودی الگوریتمهای متفاوت استفاده میشود. در روش دوم، با استفاده از ترکیب خروجی الگوریتمهای خوشهبندی و امتیاز دادن به همتافتها براساس اطلاعات بافت پروتئینهای شرکت کننده در آنها، سعی در تشخیص همتافتهای پروتئینی شده است. نتایج آزمایشها روی گونههای مختلف نشان میدهند که استفاده از شبکهی جدید به عنوان ورودی الگوریتمهای پیشبینی همتافتهای پروتئینی منجربه نتایج بهمراتب بهتری خواهد شد. همچنین روش ترکیب خروجی الگوریتمها و امتیاز دادن به همتافتها براساس اطلاعات بافت پروتئینی، باعث افزایش کارایی در تشخیص همتافتها میشود. هر دو روش ارائه شده، دقت معیارهای ارزیابی در زمینهی تشخیص همتافتهای پروتئینی را افزایش میدهند. همچنین با توجه به وجود معیارهای متنوع ارزیابی عملکرد روشهای پیشبینی همتافتهای پروتئینی، به تجزیه و تحلیل معیارهای متفاوت ارزیابی پرداخته شده است. نتایج بدست آمده تائید کننده این واقعیت است که استفاده نادرست از معیارهای ارزیابی میتواند منجر به بیشازحد برآورد نمودن کارایی یک روش پیشبینی همتافتهای پروتئین گردد. همچنین ابزاری به نام CompEvaluator با هدف جمعآوری و پیادهسازی معیارهای ارزیابی پیشنهاد شده در مقالات مختلف توسعه داده شده است. کلمات کلیدی: شبکه برهمکنش پروتئین-پروتئین، همتافتهای پروتئینی، معیارهای ارزیابی
- Abstract
- Proteins are types of biological macromolecular that are constructed from Amino acid components. Proteins do their biological functionalities by interacting together in groups. Therefore from different aspects proteins can be divided into groups based on their Pathway, Functional module and Protein complex. Detection of protein complexes can be helpful to better understand cells functionalities and treatment purposes like drug discovery. This research aims to detect protein complexes from protein-protein interaction networks (PPI). In computational methods, protein complexes are detected by using clustering algorithm on Protein-Protein interaction network. The proposed clustering algorithms, use solely protein interaction network topology or combine them with biological information to detect protein complexes. All these algorithms take a protein-protein interaction network as an input while reliability of these interaction data that are gathered from high-throughput experiment are not satisfiable. In this research, two methods are proposed to detect protein complexes. In the first method, by using evolutionary information between interspecies proteins, we generate protein-protein interaction network and use this network as input of different clustering algorithms. In the second method, protein complex detection is done by combining the output of different clustering algorithms and scoring detected protein complexes according to Protein tissue information. The experimental result on different species indicate that using the proposed network as an input of clustering algorithms leads to better protein complex detection. Also combination of different clustering algorithms output and scoring protein complex based on protein tissue information improves the performance of protein complex detection. Having different performance assessment measures for comparing protein complex detection algorithms, we also studied these measures. Our studies show that inappropriate use of performance assessment measures misevaluate performance of protein complex detection algorithms. We also developed a tool named CompEvaluator which aims to calculate different performance assessment measures proposed by previous researches. Keywords: Protein-Protein interaction network (PPI), Protein complex, Performance assessment measures