عنوان پایاننامه
به کارگیری خصوصیات پروتئین برای تشخیص هم تافت های کم تراکم در شبکه های پروتئین - پروتئین
- رشته تحصیلی
- مهندسی کامپیوتر -نرم افزار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2956;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75343;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2956;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75343
- تاریخ دفاع
- ۲۹ شهریور ۱۳۹۴
- دانشجو
- سیدمجید خیری الموسوی
- استاد راهنما
- مسعود رهگذر, کاوه کاوسی
- چکیده
- پروتئینها مواد آلی بزرگ و یکی از انواع درشت ملکول های زیستی هستند که از زیرواحدهایی به نام اسید آمینه ساخته شدهاند. پروتئینها اعمال زیستی خود را به صورت گروهی و در تعامل با یکدیگر انجام میدهند. بنابراین از منظرهای متفاوت پروتئینها در گروههای متفاوتی نظیر گذر ، واحد عملکردی و همتافت پروتئینی قرار میگیرند در این پژوهش به یافتن همتافتهای پروتئینی پرداخته شده است. در روشهای محاسباتی همتافتها را معمولاً با اعمال الگوریتمهای خوشهبندی بر شبکه تعاملات پروتئین-پروتئین به دست میآورند. اکثر روشهای خوشهبندیِ موجود شرط تراکم خوشه را برای یافتن همتافتهای پروتئینی از شبکهی تعاملات پروتئین-پروتئین در نظر میگیرند؛ در حالی که همتافتهای شناخته شده و موجود در مجموعه دادههای استاندارد نشان میدهد که این فرض برای برخی از همتافتها صحت ندارد؛ یعنی همتافتهایی وجود دارد که در شبکهی تعاملاتِ موجود تراکم پایینی دارند و به همین دلیل توسط این روشها قابل شناسایی نیستند. از این رو با هدف یافتن همتافتهای بیشتر، در این پژوهش، بر یافتن همتافتهای کمتراکم تمرکز شده است و الگوریتمی با نام SCD ارائه شده است. این الگوریتم با پردازش خوشههای حاصل از الگوریتمهای خوشهبندی دیگر، کیفیت خوشهها را بهبود بخشیده و باعث تشخیص همتافتهای بیشتری میشود. نتایج الگوریتم SCD بر روی شبکه تعاملات مخمر با سه مجموعه داده استاندارد طلایی مقایسه شده و در مقایسه با خوشههای اولیه و همچنین در مقایسه با الگوریتم SPARC که مشابه الگوریتم SCD عمل میکند، در هر سه آزمایش بهبود چشمگیری نشان داده است. واژههای کلیدی: همتافتهای پروتئینی، همتافت کمتراکم، الگوریتم خوشهبندی، تشخیص همتافت، تعاملات عملکردی
- Abstract
- Proteins are among organic compounds and one of the biological macromolecules which are made from the sub units called Amino acid. Proteins interactively perform the biological actions together. Thus, in different standpoint, proteins are categorized in different groups like, pathway, functional module and complex. In this research, the mechanism for complex protein detection is developed. In computation methods, complex are detected by applying the clustering algorithm on protein-protein interaction network. Most of the already developed clustering methods considers the cluster density for protein complex detection from the protein-protein interaction network. However, all the known complex available at the benchmark dataset shows that this assumption is not right for some complex. This means that there are some complex with lower density in available interaction networks that are not detectable with these methods. Therefore, in this research, for detecting more number of complex, the main focused is on the lower density complex and an algorithm called “SCD” is proposed. In this algorithm by processing the clusters of other clustering algorithm, the clustering quality is getting better which results in detecting more number of complex. The results of applying SCD on yeast interaction network with three gold standard dataset are compared to the initial clusters and in comparison to SPARC Algorithm, which act like SCD algorithm, in all three experiment shows a significant improvement. Keywords: proteins complex, sparse complex, clustering algorithm, complex detection, functional interaction.