عنوان پایان‌نامه

استفاده از الگوریتم ژنتیک برای انتخاب بهینه باند ها به منظور بهبود طبقه بندی تصا ویر فرا طیفی



    دانشجو در تاریخ ۳۰ بهمن ۱۳۸۹ ، به راهنمایی ، پایان نامه با عنوان "استفاده از الگوریتم ژنتیک برای انتخاب بهینه باند ها به منظور بهبود طبقه بندی تصا ویر فرا طیفی" را دفاع نموده است.


    محل دفاع
    کتابخانه پردیس 2 فنی شماره ثبت: 2155;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 54157
    تاریخ دفاع
    ۳۰ بهمن ۱۳۸۹

    تصاویر فراطیفی به دلیل دارا بودن توان تفکیک طیفی بسیار بالا ، برای کاربردهای شناسایی و کشف گستره‌ی وسیعی از مواد و پدیده‎های سطح زمینی، منبع اطلاعاتی مناسبی هستند. بنابراین این تصاویر برای تهیه نقشه‌های پوشش زمین به صورت گسترده‌ای مورد استفاده قرار می‌گیرند. با وجود این ویژگی مناسب، به دلیل ابعاد طیفی بالای این تصاویر، مشکلاتی چون محاسبات بالا و هم‌چنین افزایش خطر وقوع «پدیده هیوز» در طبقه‌بندی رخ می‌دهد. پدیده هیوز به دلیل کم بودن تعداد داده‌های آموزشی نسبت به ابعاد داده به وجود می‌آید و منجر به کاهش دقت طبقه‌بندی می‌گردد. به عنوان یک راه حل، انتخاب بهینه ویژگی‌ها در این تصاویر، به منظور کاهش ابعاد داده‌های فراطیفی راهکار مفیدی است. بنابراین انتخاب مجموعه‌ای از ویژگی‌ها که بتواند داده را به خوبی ارائه و نمایندگی کند، یک مساله مههم در تجزیه و تحلیل و پردازش این داده‌ها است. به این ترتیب، با حرف اطلاعات غیرمفید و نویز، یا ماهش همبستگی بین داده ها انتظار می‌رود دقت طبقه‌بندی افزایش یابد. تاکنون روش‌های متفاوتی برای انتخاب ویژگی ارائه شده است. با این وجود این روش‌ها هنگامی‌که فضای ویژگی محدود است، می‌توانند عملکرد مناسبی داشته باشند. اما ابعاد بسیار بالای ویژگی‌ها در تصاویر فراطیفی استفاده از چنین روش‌هایی را با محدودیت رو‌به‌رو می‌کند. بنابراین در سالهای اخیر به ‌کارگیری روش‌های نوین و الگوریتم‌های جستجوی تصادفی مانند الگوریتم ژنتیک، برای انتخاب ویژگی در تصاویر فراطیفی بیشتر مورد توجه قرار گرفته است. الگوریتم ژنتیک از روش تکامل بر مبنای اصل «بقای بهترین» بهره می‌گیرد. این شیوه یک روش کارآمد و سریع بهینه‌سازی در مسائل مختلف مهندسی است و به صورت گسترده‌ای در حل مسائل پیچیده بهینه‌سازی به‌کار برده می‌شود، انتخاب ویژگی‌های بهینه در تصاویر فراطیفی می‌تواند نمونه خوبی برای این مسائل باشد. الگوریتم ژنتیک چون یکی از روش‌های بهینه‌سازی برمبنای محاسبات هوشمند است می‌تواند رسیدن به جواب بهینه را تسهیل کند. الگوریتم طبقه‌بندی ماشین‌های بردار پشتیبان یکی از روش‌های نوین طبقه‌بندی است، که به دلیل عملکرد بسیار خوب آن در داده‌های فراطیفی در سال‌های اخیر مورد استقبال قرار گرفته است. با وجود مزایای زیادی که این الگوریتم دارد بازهم پدیده هیوز در آن رخ داده و منجر به کاهش دقت طبقه بندی می شود. به خصوص هنگامی که تعداد داده های آموزشی کم است ( 8 پیکسل برای هر کلاس) دقت طبقه بندی با استفاده از روش Wrapper به صورت میانگین 30% ، با استفاده از روش Filter به صورت میانگین 17% و با استفاده از داده های آموزشی 100 پیکسل برای هر کلاس دقت طبقه بندی در روش Wrapper به صورت میانگین 18% ، و در روش Filter به صورت میانگین 12% افزایش می دهند در حالیکه ابعاد داده به صورت قابل توجهی کاهش می یابند. این نتایج به خوبی کارایی روش انتخاب ویژگی را نشان می دهد.
    Abstract
    Hyperspectral remotely sensed data presents the excellent potential for information extraction of the earth surface because of their high spectral resolution. Therefore in recent years this remotely sensed imagery has been widely used for land cover mapping. Such high dimensionality of data provides more discrimination power in classification task, but also imposes high computational cost and complexity in data processing. In particular, because of inadequate number of training samples related to dimension of data, the proof of “curse of dimensionality” may occur. Therefore, as a necessary pre-processing step the data reduction techniques, are indispensable perform by feature selection. The feature selection techniques study how to select the most informative subset of features represents the data adequately that improve the prediction ability of classification by removing the redundant and irrelevant features. So far, various feature selection methods have been introduced, but most of them indicate some restriction in performance with high dimension data such as hyperspectral imagery. Thus, in the recent years the randomized heuristic search techniques such as Genetic Algorithm (GA) are more attractive for hyperspectral feature selection methods. Genetic algorithm is a general adaptive global optimization search method based on a direct analogy to Darwinian natural selection and genetics in biological systems. This algorithm is a fast and sufficient method to solve various complex engineering optimization problems. The Support Vector Machines is a new generation of classification system has been applied successfully in a range of problems including pattern recognition, bioinformatics, text classification, and image classification. Despite many advantages and some claims that the method is insensitive to the dimensionality of the data, it is shown that the accuracy of a classification may decline significantly with the addition of features, particularly if small training sample (8 pixels for each class) is used. In this case with wrapper and filter feature selection methods, classification accuracy increased 30% and 17% respectively. Additionally, it is demonstrated that, even when a large training sample (100 pixels for each class) is available, feature selection may still be useful. The results have shown 18% and 12% increase of classification accuracy with wrapper and filter method. In addition the significant decrease in feature subset is observed simultaneously. The results highlight the potential value of undertaking a feature selection analysis prior to classification.