پیشگویی مناطق ذاتا بی نظم در پروتئین ها به کمک روش های طبقه بندی محلی
- رشته تحصیلی
- مهندسی کامپیوتر- آلگوریتم ها و محاسبات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس یک فنی شماره ثبت: 67..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 65433
- تاریخ دفاع
- ۱۹ شهریور ۱۳۹۳
- دانشجو
- محمدجواد نیرومند
- استاد راهنما
- بابک نجاراعرابی
- چکیده
- نواحی ذاتاً بینظم در ساختار پروتئینها، آنها را قادر میسازند تا در برهمکنش های مختلف شرکت کرده و به مولکولهای متفاوتی متصل شوند. این موضوع سبب شده است این نواحی نقشی کلیدی در تولید و گسترش داروهای مدرن ایفا کنند و مورد توجه زیست شناسان قرار گیرند. تشخیص نواحی بینظم در ساختار پروتئین را میتوان به عنوان یک مسئلهی طبقهبندی دو کلاسه مطرح کرد که در سطح آمینواسیدهای زنجیرهی پروتئین صورت میپذیرد. با این توصیف روشهای طبقهبندی پایه و ترکیبی مختلفی تا کنون برای حل آن پیشنهاد شده است که نتایج قابل توجهی نیز بدست آورده اند. روشی که ما پیشنهاد دادهایم با استفاده از الگوریتم پایههای محلی بهینه گسترش یافته و تفکیک نواحی بینظم مختلف، آنها را به چند دستهی محلی تقسیم کرده و خصیصههای مناسب برای تفکیک هریک از این دستهها با هم را بدست میآورد. سپس با استفاده از این خصیصههای محلی، اقدام به طبقهبندی آمینواسیدها کند. نتایجی که از اجرای این الگوریتمهای طبقهبندی محلی بر روی آمینواسیدها صورت پذیرفت نشان داد که این شیوهی طبقهبندی میتواند در بهبود کارایی طبقهبند موثر واقع شود.
- Abstract
- Predicion of intrinsically disordered regions (IDRs) in proteins is important because of the involvement of these regions in protein functions, e.g., in signaling and transcription. IDRs induce flexibility in proteins and make it possible for proteins to bind to a variety of partners. This property has made IDRs important factors in drug development, since they may behave as binding section of proteins. The problem of finding disordered regions can be modeled as a binary classification problem where the goal is to classify the protein’s amino acid residues into two classes of “ordered” and “disordered”. In this thesis, we propose a method for predicting the IDRs in a protein from its sequence. The proposed method tries to find the optimal local bases on protein chains and classifies targets by these bases. Optimal local basis approach can be considered as a feature selection mapping from high dimensional space into a lower dimensional one. The results on two benchmark datasets show that there are various type of protein disordered regions and by using better feature set for each kind of these types, the performance of the classifier improves compared to other conventional methods.