تدوین استراتژی های محاسباتی به منظور تلفیق داده های ترانسکریپتومی (RNA-Seq) در پیش بینی های مبتنی بر ژنوم گاو شیری

عنوان پایان‌نامه

تدوین استراتژی های محاسباتی به منظور تلفیق داده های ترانسکریپتومی (RNA-Seq) در پیش بینی های مبتنی بر ژنوم گاو شیری

دانشجو در تاریخ ۰۲ شهریور ۱۳۹۵ ، به راهنمایی ، پایان نامه با عنوان "تدوین استراتژی های محاسباتی به منظور تلفیق داده های ترانسکریپتومی (RNA-Seq) در پیش بینی های مبتنی بر ژنوم گاو شیری" را دفاع نموده است.

رشته تحصیلی: ژنتیک و اصلاح نژاد دام

مقطع تحصیلی: دکتری تخصصی PhD

محل دفاع: کتابخانه مرکزی پردیس کشاورزی و منابع طبیعی شماره ثبت: 6964;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75696;کتابخانه مرکزی پردیس کشاورزی و منابع طبیعی شماره ثبت: 6964;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 75696

تاریخ دفاع: ۰۲ شهریور ۱۳۹۵

دانشجو: محمدحسین بنابازی

استاد راهنما: اردشیر نجاتی جوارمی

چکیده

لینک فایل چکیده

رونویسی از توالی های ژنومی گام نخست در ترجمه اطلاعات ژنومی به فرآورده های ژنی و بروز عملکردهای خاص نهفته شده در کدهای ژنتیکی است. از اینرو داده های ترانسکریپتومی می توانند فاصله میان ژنوتیپ و فنوتیپ را پر نموده و به درک بهتر ساز وکارهای تبدیل توالی به عملکرد کمک نمایند. در مطالعه حاضر برآنیم دریابیم آیا کاربرد آن بخش از چندشکلی های تک نوکلئوتیدی ژنومی که رونویسی می شوند در پیش بینی های مبتنی بر ژنوم، می تواند به بهبود صحت پیش بینی ها و توجیه بهتر واریانس ژنتیکی یک صفت کمک نماید؟ به این منظور، ترانسکریپتوم (توالی کل mRNA) برای نمونه ای از جمعیت گاو ماده هلشتاین آمریکا و گاو ماده کلیستانی پاکستان از طریق همردیفی و مکان یابی خوانش های RNA-Seq بر روی ژنوم مرجع گاو تشکیل شد. سپس فهرست SNP های موجود بر روی این دو ترانسکریپتوم با استفاده از دو استراتژی (1) کشف SNP بر روی ترانسکریپتوم و (2) فراخوانی SNP هایی از آرایه با تراکم بالا که موقعیت متناظر آنها در توالی ترانسکریپتوم وجود داشت، بدست آمد. این فهرست های کاهش یافته در برآورد مولفه های واریانس و پیش بینی های مبتنی بر ژنوم برای صفت باقیمانده مصرف خوراک (RFI) برای 842 تلیسه هلشتاین استرالیا به کار رفتند و با آرایه با تراکم بالا مقایسه شدند. با وجود کشف تعداد قابل قبولی SNP بر روی ترانسکریپتوم های تشکیل شده، اشتراک آنها با آرایه با تراکم بالا بسیار کم بود و از اینرو فهرستهای مشترک نتوانستند سهم بالاتری از واریانس ژنتیکی را توجیه نمایند. در مقابل، فهرست کاهش یافته 100K فراخوانی شده و مشترک بین دو نژاد که حدود 17 درصد از کل نشانگرهای تعیین کیفیت شده در آرایه اصلی را شامل می شد، توانست واریانس ژنتیکی صفت باقیمانده مصرف خوراک را به میزانی معادل با آرایه با تراکم بالا توجیه نماید (تقریبا 40 درصد) و صحت پیش بینی ها را نیز حدود 2 درصد بهبود بخشد. مطالعه حاضر نشان داد سهم عمده ای از واریانس ژنتیکی صفت باقیمانده مصرف خوارک توسط نشانگرهایی که توالی آنها بصورت mRNA رونویسی می شود قابل توجیه است و افزودن تعداد زیادی نشانگر اضافی به این فهرست، به افزایش این سهم کمک نمی کند. علاوه بر این، افزایش تراکم نشانگری احتمالا بواسطه افزایش سهم خطا در محاسبات از دقت پیش بینی ها می کاهد. در مجموع، مطالعه حاضر به کارگیری دو استراتژی محاسباتی را را برای تلفیق اطلاعات ترانسکریپتومی در پیش بینی های مبتنی بر ژنوم پیشنهاد می نماید که می تواند به معرفی آرایه های SNP کاهش یافته و/یا معرفی فهرست های جدید با قابلیت کاربرد در پیش بینی های مبتنی بر توالی کل ژنوم بیانجامد. این مطالعه ممکن است سرآغازی برای ورود به عصر پساژنومی در اصلاح نژاد حیوانات اهلی باشد.

Abstract

Transcription is the first step in translation of genome to function underlying genetic codes. Therefore, the ranscriptome might fill the gap between genotype and phenotype and help understanding the mechanisms from sequence to function. The present study was to know if application of single nucleotide polymorphisms located on transcriptome can improve the accuracy of genome enabled predictions and/or capture genetic variance well. Thus, the transcriptomes (mRNA sequence) for a US Holstein and a Pakistanian Cholistani cow population were assembled by aligning and mapping the RNA-Seq reads on bovine reference genome. The reduced SNP panels were then resulted from two following strategies (1) SNP discovery on transcriptomes and (2) calling of SNPs from Illumina Bovine HD SNP array on mRNA sequences. These latter SNP markers are not necessarily polymorphic (real SNP) in the transcriptome. The resulted panels were applied to estimate variance components and genome enabled predictions for Residual Feed Intake (RFI) trait in 842 Australian Holstein heifers and compared with Illumina high dense panels. Although it was discovered a considerable number of SNPs, most of them were not shared with Illumina bovine HD array. Therefore these shared panels didn't capture a high proportion of total genetic variance for RFI. In contrast, a reduced 100K SNP panel called from Illumina Bovine HD SNP array and shared in both cow populations could explain the same contribution of genetic variance of RFI (about 40%) for HD panel and improve predictive power (accuracy) about 2%. This study indicated that SNPs transcribed as mRNA sequences have a main contribution in genetic variance of RFI and the additional markers in HD panel couldn't result in more contribution. In addition, a higher density for markers may increase errors in computations and decrease accuracy. In conclusion, the present results recommend two computational strategies for integration of transcriptome information into genome enabled predictions. They can introduce some reduced SNP panels and/or new ones applicable in predictions based on whole genome sequence. This study might be a landmark for post genomics era in animal breeding. Key words: Dairy cattle, Transcriptome, Single Nucleutide Polimorphisms (SNP), RNA-Seq, Variance components, Predictive power (accuracy), Residual Feed Intake (RFI).

تدوین استراتژی های محاسباتی به منظور تلفیق داده های ترانسکریپتومی (RNA-Seq) در پیش بینی های مبتنی بر ژنوم گاو شیری

منوی دسترسی (CTRL+M)

رنگ متن:

رنگ پس‌زمینه:

اندازه فونت:

فاصله بین کلمات:

ارتفاع خط:

فونت:

فیلتر کوررنگی:

تنظیم کنتراست:

تنظیمات motion:

اطلاعات تماس