عنوان پایان‌نامه

توسعه و کاربرد روش های چندمتغیره کمومتریکس جهت آنالیز داده های متابولومیکس گیاهی حاصل از روش کروماتوگرافی گازی – طیف سنج جرمی




    رشته تحصیلی
    شیمی تجزیه
    مقطع تحصیلی
    دکتری تخصصی PhD
    محل دفاع
    کتابخانه پردیس علوم شماره ثبت: 6355;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 77098;کتابخانه پردیس علوم شماره ثبت: 6355;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 77098
    تاریخ دفاع
    ۱۰ مهر ۱۳۹۵

    گیاهان، به عنوان مهم‌ترین منابع تامین غذا، انرژی و بسیاری از ترکیبات دارویی همواره مورد توجه محققان بوده‎اند. متابولومیکس روشی قوی و کارآمد برای شناسایی و اندازه‎گیری متابولیت‌های گیاهی و دستیابی به درک بالاتری از مسیرهای متابولیتی است که منجر به تولید متابولیت های ارزشمند گیاهی می شوند. استخراج اطلاعات مفید و ارزشمند از داده های خام حاصل از آنالیز سیستم های پیچیده گیاهی، یکی از مراحل مهم در متابولومیکس است. تمرکز اصلی این رساله بر توسعه و کاربرد روش های چند متغیره در کمومتریکس به منظور استخراج اطلاعات مفید از داده های حاصل از آنالیز سیستم های پیچیده گیاهی با دستگاه کروماتوگرافی گازی به عنوان یکی از پرکاربردترین دستگاه های مورد استفاده در این زمینه، است. این رساله مشتمل بر شش فصل است. در فصل اول، مقدمه ای کوتاه بر متابولومیکس و استراتژی های حاکم بر آنالیز متابولیت های گیاهی ارائه شده است. در فصل دوم، ساختار و مشکلات داده های بدست آمده از کروماتوگرافی گازی مورد بررسی قرار گرفته است و در ادامه روش‌های کمومتریکس مورد استفاده برای حل مشکلات کروماتوگرافی و همچنین استخراج اطلاعات مطلوب از داده‌ها خام معرفی شده اند. در فصل سوم، مطالعه متابولیکی هدفمند بر روی 17 اسید چرب موجود در میوه آووکادو انجام شده است؛ که در بخش تجربی اسیدهای چرب از ماتریس های هدف به ترتیب استخراج، مشتق‌سازی و تغلیظ شده و در نهایت به وسیله دستگاه GC-MS آنالیز شدند. سپس، پروفایل های خالص طیفی و شویشی آنالیت های هدف با روش‌های تفکیک منحنی چند متغیره بدست آمدند و با استفاده از نتایج حاصل و مقایسه نتایج با نمونه‌های استاندارد، غلظت های دقیق این آنالیت ها در ماتریس نمونه محاسبه شدند و در انتها مقایسه ای میان پروفایل اسیدهای چرب در قسمت های مختلف (هسته و گوشته) میوه انجام گرفت. دو فصل چهارم و پنجم رساله، به مطالعه بر روی پروفایل ترکیبات فرّار زعفران ایرانی اختصاص داده شده است. در فصل 4، آنالیز نظارت نشده پروفایل های ترکیبات فرّار هفده نمونه زعفران دو استان خراسان رضوی و خراسان جنوبی برای تعیین محدوده اثر انگشت کروماتوگرافی زعفران انجام شده است. بدین منظور، متابولیت‌های فرّار زعفران، استخراج و پیش‌تغلیظ شده و توسط دستگاه GC-MS آنالیز شدند. سپس، پروفایل های خالص شویشی و طیفی تمام متابولیت‌های زعفران حاصل از روش تفکیک چند متغیره به ترتیب برای شناسایی متابولیت‌های ثانویه زعفران و تعیین غلظت های نسبی این ترکیبات در نمونه های مختلف و سرانجام مقایسه این نمونه ها با استفاده از روش‌های اکتشافی استفاده شدند. با بررسی پروفایل-های فرّار، یازده متابولیت به عنوان عوامل تعیین کننده شباهت و تفاوت میان عطر نمونه های زعفران معرفی شدند. در فصل پنجم، تفاوت پروفایل های فرّار زعفران های استان های خراسان رضوی و خراسان جنوبی در مطالعه ای جامع و نظارت شده مورد بررسی قرار گرفت. 83 نمونه زعفران تولیدی دو استان با روش ارائه شده در فصل چهارم، آنالیز شدند. پیش پردازش های لازم بر روی داده‌های کروماتوگرافی حاصل انجام گرفت، و سپس با استفاده از الگوریتم PLS-DA مدلی مناسب و معتبر با قدرت پیش بینی بالا برای تفکیک نمونه‌های این دو استان ساخته شد. عملکرد پنج روش انتخاب متغیرهای مهم برای تعیین متابولیت های مهمی که غلظت آن ها با تغییر محل کشت زعفران تغییر می کند، با یکدیگر مقایسه شدند و در انتها 9 ترکیب به عنوان نشانگرهای زیستی زعفران معرفی شدند. در فصل ششم، مطالعه نظری برای ارتقاء کُد محاسباتی روش جستجوی خطی دقیق برای بهبود عملکرد روش PARAFAC2 انجام گرفته است. از آنجا که هسته اصلی روش PARAFAC2 روش بنیادی PARAFAC است، برازش این مدل بر روی یک سری از داده‌های شبیه سازی شده اجرا و تاثیر متغیرهای مختلف در سری داده بر روی آماره های مدل بررسی شد. در عین حال، نتایج حاصل از کاربرد کُد ارائه شد با نتایج حاصل از الگوریتم استاندارد جستجوی خطی و همچنین کُد مرسوم روش جستجوی خطی دقیق مقایسه شدند.
    Abstract
    Plants as one of the most important source of food, energy and many active pharmaceutical compounds, have always been the subject of scientific studies.Metabolomics is an efficient strategy to identify and determine the plant metabolites and broaden our understanding of metabolic pathways which are leading to the production of valuable plant metabolites. Extraction of maximum valuable information from a metabolomic analysis is one of the most important steps in plant metabolomics. This PhD thesis is mainly focused on the development and application of multivariate chemometric methods in the plant metabolomics analysis.In the first chapter, the main concept of plant metabolomics and its general strategies were briefly reviewed. In chapter 2, general structure of the data obtained from gas chromatographic systems and the most common problems occur in these systems are presented and discussed. Furthermore, the underlined theory of different multivariate chemometric methods applied to extract valuable information from metabolomics data were explained. In the third chapter, a target profiling of seventeen fatty acids in avocado seed and pulp is performed. In this study, the target analytes were extracted, derivatized, preconcentrated and finally analyzed using the GC-MS technique. The pure elution and spectrum profile of each analytes were extracted using multivariate curve resolution technique. From the obtained information from real and standard samples, the concetration of target fatty acids were determined precisely. The fourth and fifth chapters are dedicated to study the volatile profile of Iranian saffron. In this regard, in the second study in chapter 4, an unsupervised study over the (dis)similarity of seventeen Iranian saffron is performed. The samples’ volatile components were extracted, preconcentrated and analyzed using the GC-MS method. Again, the pure spectral and elution profiles of all detected saffron metabolites were obtained using MCR method and were respectively used to identify the metabolites and obtain their concentration information. Finally, the unsupervised pattern recognition methods were employed to underline the main similarity and dissimilarity of saffron volatile profile; and finally, eleven saffron metabolites were introduced as the saffron volatile biomarkers. In the fifth chapter, the volatile profile of 83 saffron samples from Khorasan-e Razavi and Khorasan-e Jonoubi, the two main producer provinces in Iran, were compared. The GC-FID chromatographic data were obtained similar to the previous study; the chromatograms were then preprocessed and modelled using PLS-DA. Finally to introduce the saffron biomarkers of origin, the performance of five different variable selection methods were compared. Nine saffron metabolites, nominated by all the methods were chosen as the saffron biomarkers of origin.In chapter 6, several modifications on the MATLAB code of exact line search was performed to accelerate the alternating least square algorithm in PARAFAC and PARAFAC2 fitting. The performance of the modified code was compared with the performance of the standard line search algorithm, and also the common code of the exact line search algorithm. In order to compare these methods, 7560 artificial data set were generated with varying level of noise, dimension, rank and factor collinearity. The PARAFAC-ALS algorithm accelerated by different line search algorithm were fitted on each data sets. The results confirmed the better performance of the modified code with respect to the time and scalability.Keywords: Plant metabolomics, Gas chromatography, chemometrics, Pattern recognition, quality control