عنوان پایان‌نامه

تشخیص سرطان در تصاویر ماموگرافی با کمک روشهای یادگیری ماشین



    دانشجو در تاریخ ۲۴ شهریور ۱۳۹۵ ، به راهنمایی ، پایان نامه با عنوان "تشخیص سرطان در تصاویر ماموگرافی با کمک روشهای یادگیری ماشین" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 81723;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 81723
    تاریخ دفاع
    ۲۴ شهریور ۱۳۹۵
    دانشجو
    فهیمه ریاحی
    استاد راهنما
    مهدی تیموری, هادی ویسی

    در این پژوهش با استفاده از روش‌های پردازش تصویرطراحی و پیاده‌سازی یک سیستم کمک تشخیص سرطان پستان انجام شده‌است. در این سیستم، ابتدا در مرحله پیش‌پردازش، کیفیت تصاویر ماموگرام و کنتراست نواحی غیرنرمال موجود در تصویر، با استفاده از روش تعدیل هیستوگرام بهبود مییابد. سپس بخش‌های اضافی از قبیل برچسب‌های موجود در تصاویر، به کمک روش مولفه‌های متصل، از تصویر حذف می‌گردد. برخی ویژگی‌های دیگر از قبیل بافت پکتورال که بسیار شبیه ویژگی‌های توده سرطانی می‌باشد، در مرحله پیش‌پردازش از تصویر اصلی حذف شده و در نهایت با استفاده از روش ماتریس وزن اختلاف سطح خاکستری (GDWM)، نواحی مشکوک در تصاویر از تصویر اصلی جدا می‌گردد. بعد از این مرحله، ناحیه استخراج شده با وضعیت واقعی که توسط پزشک مشخص شده است، مقایسه می‌گردد. برای انجام این مقایسه از معیار تشابهDice استفاده شده‌است که میزان همپوشانی ناحیه استخراج شده بالای 75 درصد به‌دست آمده‌است. جهت تشخیص سرطانی بودن یا نبودن تصاویر، تصاویر به سه دسته نرمال، خوش‌خیم و بدخیم دسته‌بندی شده که برای این منظور یک ساختار سلسله‌مراتبی دو مرحله‌ای پیشنهاد شده‌است. در مرحله اول 22 ویژگی مربوط به هیستوگرام و 6 ویژگی ریخت‌شناسی از ناحیه مورد نظر(ROI) استخراج شده‌ و با استفاده از این ویژگی‌ها تصویر در دو دسته نرمال و سرطانی دسته‌بندی می‌شود. در مرحله دوم، دسته‌بندی برای انواع سرطان خوش‌خیم و بدخیم انجام گرفته‌است. بنابراین در این مرحله در کل، مجموعه ویژگی‌ها شامل 28 ویژگی مرحله قبل و 258 ویژگی مبتنی بر الگو استخراج شده‌است. ویژگی‌های مبتنی بر الگو شامل: 1. ویژگی‌های مبتنی بر ماتریس هم‌رخداد 2. ویژگی‌های مبتنی بر الگوی باینری محلی 3. ویژگی‌های مبتنی بر ماتریس GLDM 4. ویژگی‌های مبتنی بر ماتریس GLRLM هستند. در روش پیشنهادی برای کاهش وابستگی بین ویژگی‌های استخراج شده از روش‌های کاهش ابعاد غیرخطی موسوم به روش تحلیل مولفه‌های اصلی(PCA) غیرخطی استفاده شده‌است. پس از اعمال روش کاهش بعد،دسته‌بندی صورت می‌گیرد که در بهترین حالت صحتروش سلسله مراتبی ارائه شده 96.23 درصد است، این صحت نسبت به روش مرجع (94.73درصد) بهبود قابل توجهی دارد.
    Abstract
    Breast cancer continues to be a signi?cant public health problem in the world. Early detection is the key for improving breast cancer prognosis. Mammography has been one of the most reliable methods for early detection of breast carcinomas.Computer Aided Detection (CAD) system is a software that help in reading and diagnosing bearst cancers in mammograms. In this thesis, a breast cancer detection and diagnosis system is proposed using machine learning algorithms and digital Image processing technoques. To this end, Region of Interest (ROI) in mammogram is first identified after pre-processing and noise pectoral muscles removing. In order to improve the results of our method, we have implemented a pre-processing procedure to enhance the image and remove the background noise of the image. In the second stage of mass detection CAD system is to extract suspicious regions that may contain masses from the background tissue. Segmentation methods are not strong enuagth in ?nding mass locations but the result for segmentation is supposed to include the regions containing all masses even with some false positives (FP). After the preprocessing step,for detection of mass in mammogramswe used feature extraction, feature selection and classification methods. To cancer detection, classification of images need to be done into three normal, benign and malignant categories. For this purpose, a hierarchical structure is proposed that the classification is done in two stages. In the first phase, 22 histogram features and 6 morphological features from ROI is extracted and classification of normal/cancer is done.In the secondstage, classification of benign and malignant is done. At this point, the entire feature set includes 258 pattern based features and 28 histogram based features. Pattern-based features include 1- Gray Level Co-accorance Matrix 2- Local Binary Patterns 3- Gray Level RunLength Matrix and 4- Gray Level Difference Method. For reduction of dependencies between features we used nonlinear dimensionality reduction methods, known as Nonlinear Principal Compo-nents Analysis. Classification is done after applying the feature reduction method. Hierarchical classification accuracy is 96.23%, which show significant improvement compared to the ref-frence paper (94.73%). Keywords: CADs of Breast Cancer,Support Vector Machine(SVM), Digital Dataset for screening Mammography(DDSM), Feature Reduction Methods, Nonlinear Dimensionality Re-duction.