عنوان پایان‌نامه

انتخاب ویژگی های بهینه برای مکان یابی صرع لب جانبی



    دانشجو در تاریخ ۱۰ خرداد ۱۳۹۰ ، به راهنمایی ، پایان نامه با عنوان "انتخاب ویژگی های بهینه برای مکان یابی صرع لب جانبی" را دفاع نموده است.


    محل دفاع
    کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E2077;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 54259
    تاریخ دفاع
    ۱۰ خرداد ۱۳۹۰
    استاد راهنما
    حمید سلطانیان زاده

    انتخاب ویژگی های بهینه از دسته داده هایی با ابعاد بالا و حذف ویژگی های نا مربوط در طبقه بندی داده ها نقش مهمی دارد؛ چرا که وجود ویژگی های نا مرتبط، از صحت و کارایی طبقه بندی می کاهد. پایگاه داده HBIDS دارای اطلاعات ترکیبی جامعی از بیماران مبتلا به صرع لب جانبی است که تحت عمل جراحی نیز قرار گرفته اند. در پروژه حاضر، انتخاب ویژگی های بهینه از این پایگاه داده به منظور سمت یابی محل وقوع صرع و تشخیص درجه بهبودی پس از جراحی صورت گرفت. از آنجایی که بخشی از داده های HBIDS موجود نیست، جایگزینی داده های ناقص به عنوان اولین مرحله از این پروژه انجام شد. سپس به انتخاب ویژگی های بهینه پرداخته و در نهایت به منظور ارزیابی روش های انتخاب ویژگی، روش های طبقه بندی اعمال گردید. جایگزینی داده های ناقص با روشی ترکیبی از تکرار سه مرحله جایگزینی با میانگین، جایگزینی با روش hot-deck و اعمال بازه اطمینان و در نهایت boosting صورت پذیرفت. پس از تکمیل داده ها، انواعی از روش های انتخاب ویژگی فیلتر روی ویژگی های عددی (11 روش) و اسمی (3 روش) اعمال شد. کارایی روش های فیلتر با اعمال طبقه بندی کننده بیزی ساده روی ویژگی های رتبه بندی شده مورد ارزیابی قرار گرفت که از این میان به بیشینه صحت طبقه بندی سمت یابی صرع برابر با %87 و بیشینه صحت طبقه بندی بهبودی پس از جراحی برابر با %73 دست یافتیم. نتایج بهینه با ترکیب ویژگی های عددی اولیه روش WTS1 (یا FCS1) و ویژگی های اسمی اولیه از روش Relief بدست آمد. به عنوان روش پیشنهادی، روشی بر مبنای جستجوی ترتیبی و انتخاب ویژگی هیبرید ارائه شد. در این روش ابتدا ویژگی ها با روش فیلتر بر مبنای معیار همبستگی کاندید شده و سپس با روش wrapper پذیرفته و یا رد می شوند. در این پروژه با معرفی معیاری بر مبنای همبستگی ویژگی های اسمی امکان مقایسه ویژگی های عددی و اسمی با هم فراهم شد. در نهایت با اعمال روش SVM به صحت طبقه بندی برابر با %92 دست یافتیم که نسبت به روش طبقه بندی بیزی ساده و انتخاب ویژگی فیلتر روش بهینه تری است.
    Abstract
    Feature selection and excluding irrelevant features plays an important role in classification of datasets with high dimensionality, for the reason that irrelevant features decrease the classification efficiency and accuracy rate. HBIDS, the under studied dataset in this project, is a multi modality dataset that contains information from temporal lobe epileptic patients who were also taken under surgical operation. In order to lateralize TLE and surgery candidate determination, among epileptic patients, the goal in this project is to select efficient features from HBIDS. Three main steps should be accomplished to reach this goal. The first step is applying an efficient missing value management method due to the high amount of missing values. The second step looks for the efficient method of feature selection, which is followed by applying the classification methods as a measure of evaluation in the third step. Missing value imputation is accomplished by three iterative main functional modules: 1) hot-deck pre-imputation; 2) application of confidence intervals; and 3) boosting. After that, different methods of filter feature selection including 11 methods for numeric data and 3 methods for nominal data were implemented on complete data sets. The efficiency of filter methods was evaluated by applying Naïve Bayes method of classification. Results showed the maximum classification accuracy of 87% in TLE lateralization and 73% in surgery candidate selection that is related to the treatment degree after surgical operation. The maximum results belong to the methods of WTS1 (or FCS1) for numeric data and Relief for nominal data. The proposed approach in this research is a novel sequential search procedure of hybrid feature selection. The procedure, at first, pre selects features with a filter method and correlation measure, and then accepts or rejects them due to the wrapper method of feature selection. Another promotion presented in this research is a correlation-ba correlation-based measure for selecting nominal features that make comparing of nominal and numeric features possible. Finally, applying SVM method, results in 92% of classification accuracy in TLE lateralization, that proves its efficiency comparing to the filter feature selection and Naive bayes classification methods.