عنوان پایاننامه
شناسایی موتیف های ساختاری جهت بهبود پیش بینی ساختار دوم RNA
- رشته تحصیلی
- علوم کامپیوتر
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس علوم شماره ثبت: 6226;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 74100;کتابخانه پردیس علوم شماره ثبت: 6226;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 74100
- تاریخ دفاع
- ۳۱ شهریور ۱۳۹۲
- دانشجو
- فاطمه خادمیان
- استاد راهنما
- محمد گنج تابش
- چکیده
- ریبونوکلئیک اسید (RNA)، یک گونه از مولکولهای مهم زیستی است که از یک زنجیره بلند از واحدها به نام نوکلئوتید تشکیل شده است. ساختار مولکول RNA در سه سطح بیان میشود: ساختار اول RNA که صرفا یک توالی خطی از ریبونوکلئوتیدها میباشد، ساختار دوم که شامل مجموعهای از جفتهای بازی است و ساختار سوم که شکل فضایی این مولکول را نشان میدهد. از آنجا که عملکرد RNA وابسته به ساختار آن بوده و چون تعیین ساختار RNA در آزمایشگاه، بسیار هزینهبر و وقتگیر است لذا این علاقمندی وجود دارد تا ساختار دوم و سوم این مولکولها به صورت محاسباتی پیشبینی شوند. پیشبینی ساختار سوم مولکولهای RNA بسیار دشوار بوده و تا زمانی که در مورد ساختار سوم دانستههای بیشتری یافت شوند، ساختار دوم معمولا به عنوان یک تقریب خوب از آن در نظر گرفته میشود. بسیاری از مولکولهای RNA به ساختارهایی فولد میشوند که برای نقشهای تنظیمی، کاتالیزی و یا ساختاری در سلول مهم هستند. طبق تئوری ترمودینامیک، فولدهای بهینه توالی RNA، آنهایی هستند که انرژی آزاد مینیمم دارند. با مطالعه پایگاه دادههای مربوط به ساختار دوم مولکول RNA، وجود پروتئینهایی که به نواحی هیرپین و دیگر حلقههای RNA متصل میشوند و مانع از فولد شدن این نواحی میگردند، مشاهده میشود. پروتئینها در این نواحی به موتیفهای ساختاری خاصی متصل میشوند که قابلیت جفت شدن با یکدیگر را دارند. در این پایاننامه، این موتیفهای ساختاری از طریق ابزارهای یادگیری ماشین شناسایی شده و با استفاده از آنها، کارایی روشهای محاسباتی موجود برای پیشبینی ساختار دوم RNA افزایش داده شده است
- Abstract
- One of the important biological molecule is Ribonucleic Acids (RNA) that is constructed from long chains of units called nucleotides. RNA structure could be viewed in three levels: RNA primary structure is just made up of a linear sequence of ribonucleotides, the secondary structure includes list of base pairs and the tertiary one depicts 3D structure. Determining RNA structure is important, since its functionality mainly depends on it. RNA structure determination by laboratory experiments is very costly and time-consuming; bacause of these reasons there is an interest for computationally predicting its secondary and tertiary structure. RNA tertiary structure prediction is very difficult and until attaining more knowledge about tertiary structure; secondary structure is commonly considered as an acceptable approximation. Different RNA foldings produce structures that are appropriate for regulatory, catalytic and structural roles in cells. According to the thermodynamics theory, free energy of optimal folding of an RNA sequence is minimized. Studing the evidence of proteins connected to hairpin regions and other RNA loops in the RNA secondary structure databases, put forward a hypothesis that these proteins prevent folding of these regions. The proteins bind to some specific structural motifs in these regions which have ability to form base pairs with each other. This research recognizes these specific structural motifs by machine learning tools and improves the performances of current RNA secondary structure prediction methods.Keywords: secondary motif, RNA Secondary structure,minimum free energy.