عنوان پایاننامه
ایجاد یک کتابخانه روتامری وابسته به توالی وبررسی توانای آن در یشگویی کنفورماسیون زنجیره های جانبی پروتئین
- رشته تحصیلی
- بیوشیمی
- مقطع تحصیلی
- دکتری تخصصی PhD
- محل دفاع
- کتابخانه مرکز تحقیقات بیوشیمی و بیوفیزیک شماره ثبت: 11517ب;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75383;کتابخانه مرکز تحقیقات بیوشیمی و بیوفیزیک شماره ثبت: 11517ب;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75383
- تاریخ دفاع
- ۲۷ بهمن ۱۳۹۴
- دانشجو
- محمد تقی زاده
- استاد راهنما
- بهرام گلیائی
- چکیده
- کنفورماسیون زنجیره های جانبی اسیدهای آمینه به عنوان اصلی ترین بخش از هر اسید آمینه که در تعیین ساختار و عملکرد پروتئین نقش بسیار محوری دارد، همواره به اشکال گوناگون به وسیله محققین مورد مطالعه قرار گرفته است. یکی از شاخه¬های اصلی مطالعه کنفورماسیون زنجیره های جانبی، محاسبه کنفورماسیون های ارجح یا روتامرهاست. یعنی کنفورماسیون¬هایی که با تعداد محدود بتوانند نماینده کل کنفورماسیون های ممکن برای زنجیره های جانبی اسیدهای آمینه باشند. کتابخانه¬ها (یا مجموعه-های) روتامری که پایگاه داده هایی از کنفورماسیون های منتخب هستند، کاربردهای بسیار متنوع و گسترده¬ای در حوزه بیوانفورماتیک ساختاری دارند. در این زمینه تاکنون پایگاه-داده¬ها یا مجموعه های روتامری مختلفی منتشر شده است و در هر دسته از آنها یک ایده محوری مورد استفاده قرار گرفته است. بعضی از این ایده¬ها شامل فیلترینگ سختگرانه، استفاده از داده-های شبیه¬سازی دینامیک مولکولی، افزایش تعداد "بین" ، استفاده از روش های آماری پیشرفته مانند آمار بیزی، روش های مختلف تقسیم بندی زوایای فی-سای در مجموعه های وابسته به اسکلت اصلی و موارد دیگر می¬باشد. علیرغم بررسی اختصاصیت توالی در مباحث گوناگون خصوصا بررسی های کنفورماسیون اسکلت اصلی، از اختصاصیت توالی در بررسی کنفورماسیون زنجیره های جانبی باقیمانده¬های پروتئینی، استفاده چندانی نشده است. لذا در این رساله با استفاده از بررسی اختصاصیت توالی در زمینه کنفورماسیون زنجیره¬های جانبی، ابتدا یک مجموعه روتامری وابسته به توالی موسوم به "SDRL" ارائه شده و در ادامه با تعریف سه شاخص مختلف که هر کدام با استفاده از یکی از ابعاد یا خصیصه های روتامری تعریف شده¬اند، به بررسی میزان وابستگی اسیدهای آمینه مختلف در انتخاب کنفورماسیون زنجیره جانبی به باقیمانده های همسایه¬شان در توالی پرداخته¬ایم. این کار با آنالیز روتامرهای SDRL انجام شده است. برای محاسبه مجموعه روتامری SDRL از 11546 ساختار تجربی پروتئین با قدرت تفکیک کوچکتر یا مساوی 0/2 آنگستروم و فاکتور R کوچکتر یا مساوی 25/0 استفاده شده است. شباهت توالی این ساختارها همچنین کمتر یا مساوی 50% بوده است. در این کار از روش تقسیم بندی 360 درجه برای هر زاویه کای به سه قسمت 120 درجه¬ای موسوم به "بین" استفاده شد و برای هر اسید آمینه، روتامرها در فضای نمونه ای مربوط به 400 تریپلت ممکنه محاسبه شدند. به این ترتیب 1 132000 روتامر به دست آمد که در قالب یک "فایل یک سطحی" در دسترس است. تحلیل روتامرهای SDRL در قدم اول نشان داد خصوصیات مختلف روتامری شامل فراوانی نسبی روتامرها، ترتیب این فراوانیها و میانگین زوایای کای در تریپلتهای مختلف یک اسید آمینه (منظور باقیمانده میانی تریپلت است)، تغییرات زیادی دارند که از این تغییرات با استفاده از برچسب گذاری تریپلتی به خوبی میتوان در کاربردهای گوناگون مجموعههای روتامری از جمله مدلسازی(یا پیشگویی) زنجیرههای جانبی استفاده کرد. در قدم دوم با استفاده از سه شاخص به دست آمده از سه خصوصیت ذکر شده، توانستیم مشخص کنیم که اسیدهای آمینه مختلف در انتخاب کنفورماسیون زنجیره جانبی خود، مقادیر متفاوتی از وابستگی به باقیماندههای همسایه در توالی را از خود نشان میدهند.
- Abstract
- Amino acids side-chain conformation has been studied vastly in various directions because it is mainly contributes in structure and function of proteins. One of vastly studied field in this context is rotamer libraries (or rotameric databases). These databases have various applications in structural Bioinformatics. In this field there are many examples and each one of them has its specific idea. Some of these ideas are consist of robust filtering, using molecular dynamics data, increased number of bins, advanced statistical techniques like Bayesian approaches, various methods in clustering phi and psi dihedral angles in backbone dependent databases and etc. Despite the vast researches in the field of sequence specificity mostly in backbone conformation, nearly there is no sequence specificity researches on side-chain conformations. Therefore, in this thesis using sequence specificity on side-chain conformation analysis first of all, we developed a Sequence Dependent protein side-chain Rotamer Library/database (SDRL) and after that we calculated three sets of amino acid indexes to describe amount of dependency of side-chain conformational preferences to their immediately adjacent residues in the sequence for each one of 18 native amino acids. To calculate rotamers of SDRL we have been used 11546 experimental protein structures with resolution ? 2.0 and R factor ? 0.25. Sequence similarity of these structures was less than or equal to 50%. To calculate rotameric parameters 360° for each ? angle divided in to 3 120° bins and for each amino acid, rotamers calculated in 400 triplet sample spaces. Subsequently, we achieved 132000 rotamers which are accessible via a flat file. Analysis of SDRL's rotamers illustrated that various parameters included relative frequencies, frequency arrangement and ? angle averages within various triplets of each amino acid have wide range of amplitude of variations. From these wide range of amplitude variations by considering triplet labels