عنوان پایان‌نامه

شناسایی موتیف های ساختاری جهت بهبود پیش بینی ساختار دوم RNA



    دانشجو در تاریخ ۳۱ شهریور ۱۳۹۲ ، به راهنمایی ، پایان نامه با عنوان "شناسایی موتیف های ساختاری جهت بهبود پیش بینی ساختار دوم RNA" را دفاع نموده است.


    رشته تحصیلی
    علوم کامپیوتر
    مقطع تحصیلی
    کارشناسی ارشد
    محل دفاع
    کتابخانه پردیس علوم شماره ثبت: 6226;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 74100;کتابخانه پردیس علوم شماره ثبت: 6226;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 74100
    تاریخ دفاع
    ۳۱ شهریور ۱۳۹۲
    استاد راهنما
    محمد گنج تابش

    ریبونوکلئیک اسید (RNA)، یک گونه از مولکول‌های مهم زیستی است که از یک زنجیره بلند از واحدها به نام نوکلئوتید تشکیل شده است. ساختار مولکول RNA در سه سطح بیان می‌شود: ساختار اول RNA که صرفا یک توالی خطی از ریبونوکلئوتیدها می‌باشد، ساختار دوم که شامل مجموعه‌ای از جفت‌های بازی است و ساختار سوم که شکل فضایی این مولکول را نشان می‌دهد. از آن‌جا که عملکرد RNA وابسته به ساختار آن بوده و چون تعیین ساختار RNA در آزمایشگاه، بسیار هزینه‌بر و وقت‌گیر است لذا این علاقمندی وجود دارد تا ساختار دوم و سوم این مولکول‌ها به صورت محاسباتی پیش‌بینی شوند. پیش‌بینی ساختار سوم مولکول‌های RNA بسیار دشوار بوده و تا زمانی که در مورد ساختار سوم دانسته‌های بیشتری یافت شوند، ساختار دوم معمولا به عنوان یک تقریب خوب از آن در نظر گرفته می‌شود. بسیاری از مولکول‌های RNA به ساختارهایی فولد می‌شوند که برای نقش‌های تنظیمی، کاتالیزی و یا ساختاری در سلول مهم هستند. طبق تئوری ترمودینامیک، فولدهای بهینه توالی RNA، آن‌هایی هستند که انرژی آزاد مینیمم دارند. با مطالعه پایگاه داده‌های مربوط به ساختار دوم مولکول RNA، وجود پروتئین‌هایی که به نواحی هیرپین و دیگر حلقه‌های RNA متصل می‌شوند و مانع از فولد شدن این نواحی می‌گردند، مشاهده می‌شود. پروتئین‌ها در این نواحی به موتیف‌های ساختاری خاصی متصل می‌شوند که قابلیت جفت شدن با یکدیگر را دارند. در این پایان‌نامه، این موتیف‌های ساختاری از طریق ابزارهای یادگیری ماشین شناسایی شده و با استفاده از آن‌ها، کارایی روش‌های محاسباتی موجود برای پیش‌بینی ساختار دوم RNA افزایش داده شده است
    Abstract
    One of the important biological molecule is Ribonucleic Acids (RNA) that is constructed from long chains of units called nucleotides. RNA structure could be viewed in three levels: RNA primary structure is just made up of a linear sequence of ribonucleotides, the secondary structure includes list of base pairs and the tertiary one depicts 3D structure. Determining RNA structure is important, since its functionality mainly depends on it. RNA structure determination by laboratory experiments is very costly and time-consuming; bacause of these reasons there is an interest for computationally predicting its secondary and tertiary structure. RNA tertiary structure prediction is very difficult and until attaining more knowledge about tertiary structure; secondary structure is commonly considered as an acceptable approximation. Different RNA foldings produce structures that are appropriate for regulatory, catalytic and structural roles in cells. According to the thermodynamics theory, free energy of optimal folding of an RNA sequence is minimized. Studing the evidence of proteins connected to hairpin regions and other RNA loops in the RNA secondary structure databases, put forward a hypothesis that these proteins prevent folding of these regions. The proteins bind to some specific structural motifs in these regions which have ability to form base pairs with each other. This research recognizes these specific structural motifs by machine learning tools and improves the performances of current RNA secondary structure prediction methods.Keywords: secondary motif, RNA Secondary structure,minimum free energy.