عنوان پایان‌نامه

طبقه بندی انواع پروتئین های نرمال و سرطانی مربوط به سرطان ریه بر اساس خصوصیات بیو فیزیکی پروتئین ها و بررسی توالی های EST به منظور کشف ژن ها و تشکیل شبکه ژنی درگیر در سرطان ریه




    رشته تحصیلی
    بیوفیزیک
    مقطع تحصیلی
    کارشناسی ارشد
    محل دفاع
    کتابخانه مرکز تحقیقات بیوشیمی و بیوفیزیک شماره ثبت: 11044ب;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 53151
    تاریخ دفاع
    ۰۷ اسفند ۱۳۹۰
    استاد راهنما
    بهرام گلیائی

    در این مطالعه، با توجه به گستردگی سرطان ریه و اهمیت تمایز انواع تومورهای ریوی (تومورهای NSCLC (Non Small Cell- Lung Cancer) از تومورهای SCLC (Small Cell Lung Cancer) در درمان آن ها، به منظور تفکیک سریع تر این تومورها، به جستجوی روشی جدید بر اساس خصوصیات ساختاری و فیزیکوشیمیایی وابسته به توالی پروتئین های مرتبط با انواع تومورهای ریوی پرداخته شده است. به منظور جمع آوری داده، از روش های متفاوت آنالیز کتابخانه های ریزآرایه، آنالیز EST و جستجو در پایگاه داده ی Uniprot استفاده شد و در نهایت شش گروه داده ایجاد شد که سه گروه، پروتئین های افزایش بیان یافته در انواع بافت های توموری ریه و سه گروه دیگر پروتئین هایی بودند که به طور کلی در انواع تومورهای ریوی درگیرند. سپس با استفاده از سرور PROFEAT، 1497 خصوصیت ساختاری و فیزیکوشیمیایی پروتئین های ذکر شده بر اساس توالی شان استخراج شد و در مرحله ی بعد با پیاده سازی 10 مدل وزن دهی، پنج مدل القای درخت و دو مدل خوشه بندی ، مهم ترین خصوصیاتی که در تفکیک تومورهای ریوی شرکت دارند و روش های طبقه بندی و خوشه بندی مناسب جستجو شدند. توصیفگرهای خودهمبستگی بر اساس هیدروفوبیسیته و جهش پذیری نسبی اسیدهای آمینه و همچنین ترکیب دی پپتید ها ازمهم ترین توصیفگرها بودند. با استفاده از چندین مدل درخت قادر به تفکیک تومورهای ریوی شدیم واغلب این درخت ها نشان دهنده ی آبدوستی بیشتر پروتئین های مرتبط با SCLC نسبت به پروتئین های مرتبط با NSCLC بودند، به علاوه مقدار خودهمبستگی بر اساس هیدروفوبیسیته در پروتئین های مربوط به SCLC کمتر از NSCLC و میزان خودهمبستگی بر اساس جهش پذیری نسبی اسیدهای آمینه در پروتئین های SCLC بیشتر از پروتئین های NSCLC بود. با استفاده از سه مدل خوشه بندی به طور کاملا دقیق و به کمک پنج مدل به طور تقریبی به خوشه بندی صحیح پروتئین هایمان پرداختیم. همچنین با آنالیز پروموتر ژن های افزایش بیان یافته در تومورهای ریوی به شناسایی فاکتورهای رونویسی و جایگاه اتصال آن ها پرداخته شد و با ترسیم شبکه ژنی با استفاده از 16 ژن با بیان بسیار بالا در تومورهای ریوی قادر به شناسایی ژن های جدید درگیر در سرطان ریه شدیم.
    Abstract
    In this study, with attention to the extent of lung cancer and the importance of differentiation of lung tumors (tumors of NSCLC (Non-Small Cell Lung Cancer) from SCLC (Small Cell Lung Cancer) in their treatment, in order to more rapid distinguishing of these tumors, a new way based on structural and physicochemical properties of proteins that associated with different types of lung tumors is discussed. In order to collecting data, different methods of analysis of microarray’s libraries, EST analysis and search in the Uniprot database was used and finally the data was created in six groups, three groups were lung tumor proteins that over expressed in various types of lung tumors and other three groups were proteins that generally involved in lung tumors. Then using PROFEAT server, 1497 structural and physicochemical properties of discussed proteins were extracted and in the next stage with running 10 attribute weighting, 5 tree induction and 2 clustering models, most important attributes in separating lung tumors and most appropriate classification and clustering methods were searched. Autocorrelation descriptors based on hydrophobicity and relatively mutability of amino acids as well as the composition of dipeptides were the most important descriptors. Several models of trees were able to distinguish lung tumors, often these trees represent more hydrophilic protein associated with SCLC compared with NSCLC associated proteins, plus the amount of autocorrelation based on hydrophobicity in protein-related SCLC was smaller than NSCLC proteins and autocorrelation based on the relative mutability of amino acids in proteins of SCLC was greater than NSCLC associated proteins. Three clustering models were quite accurate in separating lung tumor associated proteins based on their structural and physicochemical properties; also five models were able to nearly cluster the proteins that related to any types of lung tumors. Also the promoter analysis of overexpressed genes in