عنوان پایان‌نامه

پیش بینی ریسک ابتلا به بیماری دیابت نوع۲



    دانشجو در تاریخ ۰۵ بهمن ۱۳۹۲ ، به راهنمایی ، پایان نامه با عنوان "پیش بینی ریسک ابتلا به بیماری دیابت نوع۲" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 60835;کتابخانه دانشکده علوم و فنون نوین شماره ثبت: 127
    تاریخ دفاع
    ۰۵ بهمن ۱۳۹۲
    دانشجو
    محمود حیدری
    استاد راهنما
    مهدی تیموری

    در سراسر دنیا بیماری دیابت در حال افزایش است. دیابت یکی از چهار بیماری غیر واگیر (دیابت، بیماری‌های قلبی و عروقی، بیماری‌های مزمن دستگاه تنفسی و سرطان) است که در حدود 60 درصد از مرگ‌های جهان را شامل می‌شوند. بار اقتصادی که برای این بیماری در سراسر دنیا در سال 2008 تخمین زده شده است، در حدود 2.35 تریلیون دلار است و پیش‌بینی‌شده است چنانچه در کشورهای مختلف پروژه‌هایی جهت پیشگیری از شیوع این بیماری در نظر گرفته نشود، این مبلغ به صورت نمایی افزایش پیدا کند، با توجه به این مطالب بهتر است بیماران را قبل از اینکه به مراحل پیشرفته بیماری برسند، پیدا کنیم و از این طریق با هزینه‌های سنگین دیابت مقابله نماییم. هدف ما در این پایان‌نامه طراحی یک مدل پیش‌بینی با کمترین هزینه متوسط برای شناسایی هرچه بیشتر افراد در معرض خطر دیابت نوع دو است. در این مطالعه از داده‏های مربوط به غربال‌گری بیماری دیابت نوع 2 در شهر تبریز استفاده شده است. این مجموعه داده شامل 19 ویژگی است و با توجه به اینکه نسبت افراد در معرض خطر به افراد سالم 9.35 است، این مجموعه داده جزء مجموعه داده‌های نامتوازن محسوب می‌شود. در این پژوهش تلاش شده است تا پس از بررسی کاربرد‌های یادگیری ماشین در داده‌های پزشکی، تعدادی از این روش‌ها بر روی داده‌های دیابت آزمایش شوند و نتایج آن‌ها آورده شده است. در پایان مدلی پیشنهادی بر مبنای الگوریتم رقابت استعماری و شبکه عصبی مصنوعی که نسبت به هزینه حساس است، ارائه گردیده که داده‌های دیابت نوع 2 شهر تبریز را به خوبی دسته‌بندی می‌کند و نتایج آن از الگوریتم‌های متداول یادگیری ماشین بهتر است. در این روش پیشنهادی هزینه متوسط 2.7789 دلار به دست آمد که با توجه به اینکه هزینه پایش تک‌تک افراد 5 دلار است این مدل حدود 44 درصد هزینه کمتری دارد. واژه‌های کلیدی: دیابت نوع دو، یادگیری ماشین، الگوریتم رقابت استعماری، داده‌های نامتوازن، الگوریتم‌های حساس به هزینه
    Abstract
    Diabetes is increasing worldwide and is considered as one of the four non-contagious diseases which is responsible for about 60% of deaths worldwide. The worldwide economic burden estimated for such disease in 2008 was about 2.35 Billion dollars. It is predicted that this number will increase exponentially if countries do not consider preventive projects for this disease. By the above facts its better to target diabetics before the disease gets worse. Our goal in this thesis is to design a predication model to target people who are really in the danger of getting diabetics. The data for this research is gathered from Tabriz diabetics type 2, this data set has 19 features and the ratio of healthy subjects to ill subjects are 9.35, hence this data set can be considered as an imbalanced data set. In this research we have tried to review machine learning techniques and apply some of them on our data set, and the results are reported. Finally a model is proposed which is based on neural networks and Imperialist Competitve Algorithm (ICA), this algorithms is sensitive to cost and classifies Tabriz data very well, and its results are much better than common machine learning techniques. In this model average cost is 2.7789$ which is about 44% lower than the usual method ($5). Keywords: Diabetes Type 2, Machine Learning, Imperialist Competitve Algorithm, Imbalance data, Cost Sensitive Algorithm