عنوان پایاننامه
تشخیص سرطان در تصاویر ماموگرافی با کمک روشهای یادگیری ماشین
- رشته تحصیلی
- مهندسی فناوری اطلاعات پزشکی
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 81723;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 81723
- تاریخ دفاع
- ۲۴ شهریور ۱۳۹۵
- دانشجو
- فهیمه ریاحی
- استاد راهنما
- مهدی تیموری, هادی ویسی
- چکیده
- در این پژوهش با استفاده از روشهای پردازش تصویرطراحی و پیادهسازی یک سیستم کمک تشخیص سرطان پستان انجام شدهاست. در این سیستم، ابتدا در مرحله پیشپردازش، کیفیت تصاویر ماموگرام و کنتراست نواحی غیرنرمال موجود در تصویر، با استفاده از روش تعدیل هیستوگرام بهبود مییابد. سپس بخشهای اضافی از قبیل برچسبهای موجود در تصاویر، به کمک روش مولفههای متصل، از تصویر حذف میگردد. برخی ویژگیهای دیگر از قبیل بافت پکتورال که بسیار شبیه ویژگیهای توده سرطانی میباشد، در مرحله پیشپردازش از تصویر اصلی حذف شده و در نهایت با استفاده از روش ماتریس وزن اختلاف سطح خاکستری (GDWM)، نواحی مشکوک در تصاویر از تصویر اصلی جدا میگردد. بعد از این مرحله، ناحیه استخراج شده با وضعیت واقعی که توسط پزشک مشخص شده است، مقایسه میگردد. برای انجام این مقایسه از معیار تشابهDice استفاده شدهاست که میزان همپوشانی ناحیه استخراج شده بالای 75 درصد بهدست آمدهاست. جهت تشخیص سرطانی بودن یا نبودن تصاویر، تصاویر به سه دسته نرمال، خوشخیم و بدخیم دستهبندی شده که برای این منظور یک ساختار سلسلهمراتبی دو مرحلهای پیشنهاد شدهاست. در مرحله اول 22 ویژگی مربوط به هیستوگرام و 6 ویژگی ریختشناسی از ناحیه مورد نظر(ROI) استخراج شده و با استفاده از این ویژگیها تصویر در دو دسته نرمال و سرطانی دستهبندی میشود. در مرحله دوم، دستهبندی برای انواع سرطان خوشخیم و بدخیم انجام گرفتهاست. بنابراین در این مرحله در کل، مجموعه ویژگیها شامل 28 ویژگی مرحله قبل و 258 ویژگی مبتنی بر الگو استخراج شدهاست. ویژگیهای مبتنی بر الگو شامل: 1. ویژگیهای مبتنی بر ماتریس همرخداد 2. ویژگیهای مبتنی بر الگوی باینری محلی 3. ویژگیهای مبتنی بر ماتریس GLDM 4. ویژگیهای مبتنی بر ماتریس GLRLM هستند. در روش پیشنهادی برای کاهش وابستگی بین ویژگیهای استخراج شده از روشهای کاهش ابعاد غیرخطی موسوم به روش تحلیل مولفههای اصلی(PCA) غیرخطی استفاده شدهاست. پس از اعمال روش کاهش بعد،دستهبندی صورت میگیرد که در بهترین حالت صحتروش سلسله مراتبی ارائه شده 96.23 درصد است، این صحت نسبت به روش مرجع (94.73درصد) بهبود قابل توجهی دارد.
- Abstract
- Breast cancer continues to be a signi?cant public health problem in the world. Early detection is the key for improving breast cancer prognosis. Mammography has been one of the most reliable methods for early detection of breast carcinomas.Computer Aided Detection (CAD) system is a software that help in reading and diagnosing bearst cancers in mammograms. In this thesis, a breast cancer detection and diagnosis system is proposed using machine learning algorithms and digital Image processing technoques. To this end, Region of Interest (ROI) in mammogram is first identified after pre-processing and noise pectoral muscles removing. In order to improve the results of our method, we have implemented a pre-processing procedure to enhance the image and remove the background noise of the image. In the second stage of mass detection CAD system is to extract suspicious regions that may contain masses from the background tissue. Segmentation methods are not strong enuagth in ?nding mass locations but the result for segmentation is supposed to include the regions containing all masses even with some false positives (FP). After the preprocessing step,for detection of mass in mammogramswe used feature extraction, feature selection and classification methods. To cancer detection, classification of images need to be done into three normal, benign and malignant categories. For this purpose, a hierarchical structure is proposed that the classification is done in two stages. In the first phase, 22 histogram features and 6 morphological features from ROI is extracted and classification of normal/cancer is done.In the secondstage, classification of benign and malignant is done. At this point, the entire feature set includes 258 pattern based features and 28 histogram based features. Pattern-based features include 1- Gray Level Co-accorance Matrix 2- Local Binary Patterns 3- Gray Level RunLength Matrix and 4- Gray Level Difference Method. For reduction of dependencies between features we used nonlinear dimensionality reduction methods, known as Nonlinear Principal Compo-nents Analysis. Classification is done after applying the feature reduction method. Hierarchical classification accuracy is 96.23%, which show significant improvement compared to the ref-frence paper (94.73%). Keywords: CADs of Breast Cancer,Support Vector Machine(SVM), Digital Dataset for screening Mammography(DDSM), Feature Reduction Methods, Nonlinear Dimensionality Re-duction.