عنوان پایاننامه
طراحی سیستم خبره جهت عیب یابی پالایشگاه گاز با شبکه بیزین
- رشته تحصیلی
- مهندسی شیمی
- مقطع تحصیلی
- دکتری تخصصی PhD
- محل دفاع
- کتابخانه پردیس یک فنی شماره ثبت: 1783.;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 77258;کتابخانه پردیس یک فنی شماره ثبت: 1783.;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 77258
- تاریخ دفاع
- ۲۸ تیر ۱۳۹۵
- دانشجو
- مهدیه عسکریان
- استاد راهنما
- فرهنگ جلالی فراهانی, رضا ضرغامی
- چکیده
- در این پژوهش سامانه خبره عیب یابی برای فرایندهای شیمیایی طرح ریزی گردید. سامانه عیب یابی بر اساس داده های برگرفته از تاریخچه واحد فرایندی و به وسیله شبکه بیزین ایجاد گردید. این سامانه قادر است محتمل ترین عیب متناظر با داده های جدید را تعیین نماید. در این پژوهش به بررسی عملکرد سامانه عیب یابی در مواجه با دو چالش پرداخته شد: 1) بانک داده های ناهمگن؛ 2) نقصان بانک داده ها. یک روش نوین مبنی بر شبکه بیزین، جهت طرح ریزی سامانه عیب یابی بر اساس داده-های ناهمگن ارائه گردید. احتمال پیشین غیریکنواخت عیوب در سه گام آموزش سامانه، پیش بینی عیوب و به روز رسانی سامانه، منظور شد. به علاوه تلفیق تحلیل اجزا مستقل با روش پیشنهادی، باعث بهبود عملکرد سامانه عیب یاب گردید. دقت سامانه عیب یاب پیشنهادی در مقایسه با روش طبقه بندی C4.5 در فرایند شیمیایی تنسی ایستمن، 37% بهبود یافت. سپس جهت پیاده سازی این سامانه عیب-یاب در واحد شیرین سازی پالایشگاه، احتمال پیشین غیریکنواخت عیوب از طریق روش "درخت خطا" محاسبه گردید. نتایج این مطالعه نشان می دهد شبکه بیزین دقت قابل ملاحظه ای در پیش بینی عیوب نسبت به سایر روش های غیر احتمالاتی دارد. سپس جهت مواجه با داده های ناقص، پنج روش طبقه بندی (مرکزیابی، C4.5 ، شبکه بیزین، بیز نایو گاوسی و ماشین های بردار پشتیبانی) با چهار روش برآورد داده های ناموجود (میانگین، نزدیک ترین k همسایگی، تحلیل اجزا اساسی و شبکه های عصبی) ترکیب گردید. روش های ترکیبی ارائه شده از منظر شاخص های متفاوت مورد ارزیابی قرار گرفت. ترکیب روش های C4.5 با نزدیک ترین k همسایگی بالاترین دقت، 75%، را دارد. عملکرد روش ماشین های بردار پشتیبانی، صرف نظر از نوع روش برآورد، نسبت به نرخ داده های ناموجود بالاترین مقاومت، 8/0، را دارد. روش بیز نایو گاوسی نسبت به میزان داده های ناموجود بسیار حساس است. روش برآورد تحلیل اجزا اساسی نیز، در صورتی که زمان محاسبات از اهمیت برخوردار باشد، مناسب به نظر می رسد. به علاوه برای ارزیابی بار اطلاعاتی بانک داده های ناقص شاخص "نسبت هم افزایی" ارائه گردید. نتایج بیان گر آن است که داده های ناموجود واحد شیرین سازی پالایشگاه گاز، الگوی اتفاقی دارد. در پایان پس از پیشنهاد روش "شاخص مشارکت"، نشان داده شد حجم محاسبات سامانه عیب یابی کاهش چشم گیری یافت.
- Abstract
- In the present study, data-driven fault diagnosis (FD) systems of chemical plants was developed using Bayesian network. Two different challanges regading FD was discussed and resolved: i) imbalanced dataset, ii) incomplete dataset. The imbalanced dataset was originated in frequent and rare faults in history of the plant. A novel diagnostic framework based on the Bayesian network (BN) was proposed to incorporate fault occurance rate and integration of micro-macro data. Fault tree analysis was applied to achive prior probabilities of faults. Moreover, FD was enhanced by the independent component analysis due to extraction of significant features. The proposed framework was implemented on the Tenneesse Eastman process and the gas sweetening unit of gas refinery. It was shown that the diagnostic performance of this approach promises 21% improvement regarding FD of the gas sweetening unit. Thereafter, this work addressed diagnostic systems facing incomplete observations. Different approaches for handling missing data and corresponding performances were discussesed. It was shown that integration of the BN with imputation methods enhanced its accuracy. The use of several indicators revealed the trade-off between performances of the different schemes. Support vector machines (SVM) and C4.5, combined with k-nearest neighbourhood (kNN), produce the highest robustness and accuracy, respectively. Gaussian naïve Bayes (GNB) is sensitive to imputation values. In addition, feature selection was explored for further performance enhancement, and the proposed contribution index showed promising results. Finally, an industrial case was studied to assess informative level of incomplete data in terms of the redundancy ratio and generalize the discussion