عنوان پایاننامه
پیش بینی ریسک ابتلا به بیماری دیابت نوع۲
- رشته تحصیلی
- مهندسی فناوری اطلاعات پزشکی
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 60835;کتابخانه دانشکده علوم و فنون نوین شماره ثبت: 127
- تاریخ دفاع
- ۰۵ بهمن ۱۳۹۲
- دانشجو
- محمود حیدری
- استاد راهنما
- مهدی تیموری
- چکیده
- در سراسر دنیا بیماری دیابت در حال افزایش است. دیابت یکی از چهار بیماری غیر واگیر (دیابت، بیماریهای قلبی و عروقی، بیماریهای مزمن دستگاه تنفسی و سرطان) است که در حدود 60 درصد از مرگهای جهان را شامل میشوند. بار اقتصادی که برای این بیماری در سراسر دنیا در سال 2008 تخمین زده شده است، در حدود 2.35 تریلیون دلار است و پیشبینیشده است چنانچه در کشورهای مختلف پروژههایی جهت پیشگیری از شیوع این بیماری در نظر گرفته نشود، این مبلغ به صورت نمایی افزایش پیدا کند، با توجه به این مطالب بهتر است بیماران را قبل از اینکه به مراحل پیشرفته بیماری برسند، پیدا کنیم و از این طریق با هزینههای سنگین دیابت مقابله نماییم. هدف ما در این پایاننامه طراحی یک مدل پیشبینی با کمترین هزینه متوسط برای شناسایی هرچه بیشتر افراد در معرض خطر دیابت نوع دو است. در این مطالعه از دادههای مربوط به غربالگری بیماری دیابت نوع 2 در شهر تبریز استفاده شده است. این مجموعه داده شامل 19 ویژگی است و با توجه به اینکه نسبت افراد در معرض خطر به افراد سالم 9.35 است، این مجموعه داده جزء مجموعه دادههای نامتوازن محسوب میشود. در این پژوهش تلاش شده است تا پس از بررسی کاربردهای یادگیری ماشین در دادههای پزشکی، تعدادی از این روشها بر روی دادههای دیابت آزمایش شوند و نتایج آنها آورده شده است. در پایان مدلی پیشنهادی بر مبنای الگوریتم رقابت استعماری و شبکه عصبی مصنوعی که نسبت به هزینه حساس است، ارائه گردیده که دادههای دیابت نوع 2 شهر تبریز را به خوبی دستهبندی میکند و نتایج آن از الگوریتمهای متداول یادگیری ماشین بهتر است. در این روش پیشنهادی هزینه متوسط 2.7789 دلار به دست آمد که با توجه به اینکه هزینه پایش تکتک افراد 5 دلار است این مدل حدود 44 درصد هزینه کمتری دارد. واژههای کلیدی: دیابت نوع دو، یادگیری ماشین، الگوریتم رقابت استعماری، دادههای نامتوازن، الگوریتمهای حساس به هزینه
- Abstract
- Diabetes is increasing worldwide and is considered as one of the four non-contagious diseases which is responsible for about 60% of deaths worldwide. The worldwide economic burden estimated for such disease in 2008 was about 2.35 Billion dollars. It is predicted that this number will increase exponentially if countries do not consider preventive projects for this disease. By the above facts its better to target diabetics before the disease gets worse. Our goal in this thesis is to design a predication model to target people who are really in the danger of getting diabetics. The data for this research is gathered from Tabriz diabetics type 2, this data set has 19 features and the ratio of healthy subjects to ill subjects are 9.35, hence this data set can be considered as an imbalanced data set. In this research we have tried to review machine learning techniques and apply some of them on our data set, and the results are reported. Finally a model is proposed which is based on neural networks and Imperialist Competitve Algorithm (ICA), this algorithms is sensitive to cost and classifies Tabriz data very well, and its results are much better than common machine learning techniques. In this model average cost is 2.7789$ which is about 44% lower than the usual method ($5). Keywords: Diabetes Type 2, Machine Learning, Imperialist Competitve Algorithm, Imbalance data, Cost Sensitive Algorithm