عنوان پایاننامه
داده کاوی ویژگیهای پزشکی بیماران به هدف تشخیص خودکار با استفاده از الگوریتمهای هوشمند
- رشته تحصیلی
- مهندسی برق- مهندسی پزشکی - بیوالکتریک
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E1902;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 49119;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 1902
- تاریخ دفاع
- ۱۰ خرداد ۱۳۹۰
- دانشجو
- نازلی خیرابی
- استاد راهنما
- حمید سلطانیان زاده
- چکیده
- داده کاوی به معنای استخراج اطلاعات نهفته، بازشناخت روابط و الگوهای پنهان و به طور کلی کشف دانش سودمند از داده با حجم بالا است. استخراج قواعد طبقه بندی نوعی داده کاوی است که در آن دانشی به شکل چندین قانون ساده و فهم پذیر از داده کشف شده و در آینده برای تصمیم گیری و پیشگویی به کار برده می شود. از مهمترین زمینه های کاربردی استخراج قواعد طبقه بندی در حیطه علم پزشکی است. با بکار گیری الگوریتم های داده کاو می توان سیستم های هوشمندی ابداع نمود که به شکل خودکار و بدون نیاز به نظارت پزشک قادر به فهم و تفسیر ویژگی های پزشکی افراد باشند، و یا اطلاعات مفیدی را اکتشاف نمایند که متخصصان را در قضاوت صحیح یاری رساند. در ادبیات داده کاوی تا کنون مجموعه بسیار متنوعی از روش ها ارائه گشته است که هر یک دارای نقاط ضعف و قدرت به خصوصی بوده عملکرد آن بسته به نوع داده و شرایط حاکم بر مساله متفاوت است بنابر این نمی تواند به تنهایی بهترین روش تلقی شود. در این پژوهش به بررسی، پیاده سازی و استفاده ترکیبی از الگوریتم ها و راهکار های گوناگون داده کاوی، و ارائه روش های جدید و کارآمد تری به منظور پیش بینی و طبقه بندی پرداخته ایم. چندی از مهم ترین روش های کلاسیک شناخته شده موجود را بررسی و پیاده سازی کرده ایم و سه روش بسیار کارآمد جهت کشف قواعد طبقه بندی مبتنی بر الگوریتم های تکاملی و ابزار های جستجو قدرتمند GA ، PSO و IWO پیشنهاد نموده ایم که به کار گیری الگوریتم بهینه سازی علف هرز (IWO) به منظور داده کاوی برای نخستین بار نوآوری این پژوهش محسوب می گردد. همچنین در این پژوهش یک روش جدید و ابتکاری تلفیقی جهت استخراج قواعد طبقه بندی از شبکه عصبی RBF آموزش یافته به کمک الگوریتم کلنی مورچه گان پیشنهاد نموده ایم. در اعمال به چندین مجموعه داده مرجع برتری عملکرد کلیه الگوریتم های پیشنهادی در کشف اطلاعات مفید و استخراج قواعد طبقه بندی دقیق و تفسیر پذیر، نسبت به روش های کلاسیک به اثبات رسیده است. این روش ها توانسته اند داده های Wisconsin مربوط به بیماران مبتلا به سرطان را با دقت بالای 99% به درستی طبقه بندی نمایند هرچند طبقه بندی مجموعه داده های SPECT قلبی دشوار تر بوده و دقت از حدود 80% فراتر نرفته است.
- Abstract
- Data mining is the process of extracting implicit previously unknown information, recognizing hidden patterns and relations, and generally discovering interesting and useful knowledge from large datasets. Extracting classification rules is a data mining process in which the knowledge is in the form of several simple and comprehensible rules that are extracted from dataset to be used for prediction or decision making. A dominant application domain of classification rule extraction is in the field of medical science, as intelligent systems could be devised by data mining techniques that are able to comprehend and interpret medical features automatically without the supervision of a physician, or to discover some useful information that help specialists for more accurate judgment and decision making. Various families of methods have been proposed in data mining literature so far but no single best solution has been introduced yet, as each method has its own special pros and cons and performs differently for variant data types and problem conditions. In this research, we have examined and implemented different data mining algorithms, combined various strategies, and concluded some novel and effective methods for classification and prediction. Several most prominent and classic classification methods are implemented and three powerful methods based on evolutionary algorithms, Genetic Algorithm (GA), Particle Swarm Optimization (PSO), and Invasive Weed Optimization (IWO) have been proposed for classification rule extraction. The method based on IWO is quite novel and for the first time, it is applied to a data mining problem. Moreover, we have proposed an innovative method for classification rule extraction from trained RBF neural network via an ant colony algorithm. All proposed methods have outstanding performance in extracting accurate and interpretable classification rules when applied to several benchmark datasets and seem to outperform classic data mining methods considerably. According to the results, all these methods achieve accuracy of above 99% in classifying the well-known Wisconsin breast cancer dataset. However for more complex datasets such as SPECT heart data, the achieved correct classification rates of proposed algorithms are not better than about 80%.