عنوان پایان‌نامه

پیشگویی مناطق ذاتا بی نظم در پروتئین ها به کمک روش های طبقه بندی محلی



    دانشجو در تاریخ ۱۹ شهریور ۱۳۹۳ ، به راهنمایی ، پایان نامه با عنوان "پیشگویی مناطق ذاتا بی نظم در پروتئین ها به کمک روش های طبقه بندی محلی" را دفاع نموده است.


    محل دفاع
    کتابخانه پردیس یک فنی شماره ثبت: 67..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 65433
    تاریخ دفاع
    ۱۹ شهریور ۱۳۹۳
    استاد راهنما
    بابک نجاراعرابی

    نواحی ذاتاً بی‌نظم در ساختار پروتئین‌ها، آنها را قادر می‌سازند تا در برهم‌کنش ‌های مختلف شرکت کرده و به مولکول‌های متفاوتی متصل شوند. این موضوع سبب شده است این نواحی نقشی کلیدی در تولید و گسترش داروهای مدرن ایفا کنند و مورد توجه زیست شناسان قرار گیرند. تشخیص نواحی بی‌نظم در ساختار پروتئین را می‌توان به عنوان یک مسئله‌ی طبقه‌بندی دو کلاسه مطرح کرد که در سطح آمینو‌اسیدهای زنجیره‌ی پروتئین صورت می‌پذیرد. با این توصیف روش‌‎های طبقه‌بندی پایه و ترکیبی مختلفی تا کنون برای حل آن پیشنهاد شده است که نتایج قابل توجهی نیز بدست آورده اند. روشی که ما پیشنهاد داده‌ایم با استفاده از الگوریتم پایه‌های محلی بهینه گسترش یافته و تفکیک نواحی بی‌نظم مختلف، آنها را به چند دسته‌ی محلی تقسیم کرده و خصیصه‌های مناسب برای تفکیک هریک از این دسته‌ها با هم را بدست می‌آورد. سپس با استفاده از این خصیصه‌های محلی، اقدام به طبقه‌بندی آمینواسیدها کند. نتایجی که از اجرای این الگوریتم‌های طبقه‌بندی محلی بر روی آمینواسیدها صورت پذیرفت نشان داد که این شیوه‌ی طبقه‌بندی می‌تواند در بهبود کارایی طبقه‌بند موثر واقع شود.
    Abstract
    Predicion of intrinsically disordered regions (IDRs) in proteins is important because of the involvement of these regions in protein functions, e.g., in signaling and transcription. IDRs induce flexibility in proteins and make it possible for proteins to bind to a variety of partners. This property has made IDRs important factors in drug development, since they may behave as binding section of proteins. The problem of finding disordered regions can be modeled as a binary classification problem where the goal is to classify the protein’s amino acid residues into two classes of “ordered” and “disordered”. In this thesis, we propose a method for predicting the IDRs in a protein from its sequence. The proposed method tries to find the optimal local bases on protein chains and classifies targets by these bases. Optimal local basis approach can be considered as a feature selection mapping from high dimensional space into a lower dimensional one. The results on two benchmark datasets show that there are various type of protein disordered regions and by using better feature set for each kind of these types, the performance of the classifier improves compared to other conventional methods.