برآوردپارنترهای الگوی مارکف پنهان پروفایل
- رشته تحصیلی
- آمار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس علوم شماره ثبت: 3963;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 43800
- تاریخ دفاع
- ۱۸ بهمن ۱۳۸۸
- دانشجو
- رزا اقدم
- استاد راهنما
- سودابه شمه سوار
- چکیده
- الگوهای مارکف پنهان ابزارهای کاربردی هستند که با موفقیت در بسیاری از زمینه ها در علم بیوانفورماتیک بکار برده برده می شوند. الگوی مارکف پنهان پروفایل یک فرم استاندارد از الگوی مارکف پنهان می باشند که برای الگوبندی خانواده های DNA و پروتئین استفاده می شوند. براورد پارامترهای الگوی مارکف پنهان پروفایل یکی از مسائل پر اهمیت در علم بیوانفورماتیک می باشد. برای پارامترهای الگوی مارکف پنهان پروفایل دو روش شناخته شده الگوریتم بام-ولش و زنجیر مارکف مونت کارلوی بیزی مورد مطالعه قرار گرفته شده اند. در این پایان نامه ابتدا به مقایسه دو روش فوق برای پارامترهای الگوی مارکف پنهان پروفایل می پردازیم. معمولاٌ در الگوی مارکف پنهان تنها اطلاعات یک جهت داده ها مورد بررسی قرار می گیرد، به منظور پیش بینی دقیق تر رخداد داده ها، اطلاعات دو جهت هر دنباله برای براورد پارامترهای الگوی مارکف پنهان پروفایل در نظر گرفته می شود. نتایج حاصل نشان داد که با در نظر گرفتن اطلاعات دو جهت هر دنباله، توانایی ما برای مقایسه دو روش بالاتر می رود. با بررسی نتایج می توان به این نتایج می توان به این رسید که روش زنجیر مارکف مونت کالوی بیزی برای براورد پارامترهای الگوی مارکف پنهان پروفایل نسبت به روش ماکزیمم درستنمایی مناسب تر می باشد. هم چنین نتایج حاصل از در نظر گرفتن اطلاعات دو جهت هر دنباله و نتایج از بکارگیری تنها اطلاعات یک جهت هر دنباله مورد مقایسه قرار گرفته شد. در ادامه دنباله های تعلیمی براساس وزن دنباله ها طبقه بندی شده سپس با بکارگیری یک روش ابتکاری پارامترهای الگوی مارکف پنهان پروفایل براورد شدند. واژه های کلیدی: الگوی مارکف پنهان : الگوی مارکف پنهان پروفایل، الگوریتم بام – ولش، روش زنجیر مارکف مونت کارلوی بیزی، وزن دنباله ها، دنباله های تعلیمی، دنباله آرمون
- Abstract
- Hidden markov (hmms) are practical tools with have been successfully implemented in many fields of bioinformatics. A profile hidden markov models(phmm)is a standard form of hmms, that used for modeling protein and DNA sequence families based on multiple alignment. Estimating parameters of phmm is a challenging task in bioinformatics the baum Welch algorithm and bayesiyan monte carlo markov chain (bmcmc) methods are well studied approachs in this field. In this thesis first we compare two methods that applied for estimating parameters of a phmm. Although the common methods for estimating parameters hmms usually consider the left side information of each observation in order to improve the prediction accuracy of hmms we consider information on both sides of residues in a sequence for parameter estimation. The results show that using information on both sides of residues enables to compare different methods for parameter estimation more precisely. It is concluded that bmcmc method performs better than maximum likelihood estimation. We also compare our results with those obtained when the left-to-right phmm is applied. In addition we have classified the training data based on the weighted values of the sequence and the methodology applied for estimating parameter of phmm.