عنوان پایاننامه
پیدا کردن موتیف های سه بعدی در ساختار RNA
- رشته تحصیلی
- علوم کامپیوتر
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس علوم شماره ثبت: 4873;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 55222
- تاریخ دفاع
- ۲۹ شهریور ۱۳۹۱
- دانشجو
- فاطمه اشعری قمی
- استاد راهنما
- محمد گنج تابش
- چکیده
- RNA ها از درشت مولکولهای مهم برای همهی اشکال حیات بوده و وظایف متعددی از جمله کدگذاری اطلاعات ژنتیکی، کاتالایز کردن واکنشهای شیمیایی و کنترل بیان ژن را بر عهده دارند. بنابراین، مطالعه و شناخت RNAها از اهمیت ویژهای برخوردار است. یکی از مسائل مطرح که میتواند منجر به شناسایی RNA ها و وظایف آنها و درک نحوهی فولد شدن آنها شود، مسألهی پیدا کردن موتیف میباشد. موتیفها بخشهای معناداری در ساختار RNA هستند که به دفعات تکرار شده و نقش مهمی در عملکردهای زیستی بازی میکنند. RNA با سه ساختار تعریف میشود: ساختار اول که شامل توالی خطی از نوکلئوتیدها است، ساختار دوم که شامل مجموعهای از جفت بازها در ساختار سه بعدی است و ساختار سوم که شکل فضایی یک مولکول RNA است. از آنجا که ساختار واقعی RNA یک ساختار سه بعدی میباشد، بهترین و دقیقترین روش برای یافتن موتیفها در نظر گرفتن آنها در ساختار سه بعدی RNA است. مسائل یافتن موتیف معمولاً به دو صورت تعریف میشوند. در دستهی اول یک نمونهی از پیش تعیین شده وجود داشته و بخشهای مشابه با آن جستجو میشوند و در دستهی دوم بدون داشتن اطلاعات اولیه، به یافتن موتیفها پرداخته میشود. در این پایان نامه، هدف حل مسائل نوع دوم است که به دلیل عدم وجود اطلاعات قبلی پیچیدهتر از نوع اول هستند. از ویژگیهای RNA که برای یافتن موتیف سه بعدی مورد استفاده قرار میگیرند، مختصات کارتزین و زوایای پیچش میباشند. در این پایان نامه، با خوشهبندی قطعات بر اساس زوایای پیچش بخشهایی که قابلیت موتیف بودن دارند شناسایی شده و سپس با طبقهبندی بر اساس مختصات کارتزین نتایج بهبود مییابد. با استفاده از روش مذکور، تعداد کثیری از موتیفها با دقت بالایی شناسایی میشوند. کلمات کلیدی: ساختار سوم RNA، موتیف، زاوایای پیچش، مختصات کارتزین، خوشهبندی، طبقهبندی
- Abstract
- RNAs are significant molecules in all forms of life and play a variety of roles such as coding genetic information, catalyzing chemical reactions, regulating gene expression, etc. Thus, studying and recognizing RNA structures is a matter of great importance. A momentous issue, which brings about recognizing RNA structures and their functions and understanding their folding patterns, is the motif finding problem. Motifs are meaningful fragments in RNA structures which occur repeatedly and play a prominent role in biological functions. RNAs are defined with three different structures: the primary structure which is a sequence of nucleotides, the secondary structure which contains a set of base pairs in 3D structure, and the tertiary structure which is the spatial form of an RNA molecule. Since the actual RNA structure is a 3D structure, the best and the most meticulous method for finding motifs is to consider RNAs with their 3D structures. There are two types of motif finding problems. In the first type, there is a query motif and similar fragments are searched, and in the second type, motifs are found without any initial information. In this research, a solution for the second problem is proposed. This type is more sophisticated because of the lack of preliminary information. Some RNA attributes that are used for finding 3D motifs are Cartesian coordinates and torsion angles. In this research, potential motifs are found by clustering fragments according to their torsion angles and then, the results are improved by a classification method based on Cartesian coordinates. This method finds a great number of motifs accurately. Keywords: RNA tertiary structure, Motif, Torsion angles, Cartesian coordinates, Clustering, Classification