استفاده از الگوریتم ژنتیک برای انتخاب بهینه باند ها به منظور بهبود طبقه بندی تصا ویر فرا طیفی
- رشته تحصیلی
- مهندسی عمران- نقشه برداری- سنجش ازدور
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس 2 فنی شماره ثبت: 2155;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 54157
- تاریخ دفاع
- ۳۰ بهمن ۱۳۸۹
- دانشجو
- ناصحه جمشیدپور
- چکیده
- تصاویر فراطیفی به دلیل دارا بودن توان تفکیک طیفی بسیار بالا ، برای کاربردهای شناسایی و کشف گسترهی وسیعی از مواد و پدیدههای سطح زمینی، منبع اطلاعاتی مناسبی هستند. بنابراین این تصاویر برای تهیه نقشههای پوشش زمین به صورت گستردهای مورد استفاده قرار میگیرند. با وجود این ویژگی مناسب، به دلیل ابعاد طیفی بالای این تصاویر، مشکلاتی چون محاسبات بالا و همچنین افزایش خطر وقوع «پدیده هیوز» در طبقهبندی رخ میدهد. پدیده هیوز به دلیل کم بودن تعداد دادههای آموزشی نسبت به ابعاد داده به وجود میآید و منجر به کاهش دقت طبقهبندی میگردد. به عنوان یک راه حل، انتخاب بهینه ویژگیها در این تصاویر، به منظور کاهش ابعاد دادههای فراطیفی راهکار مفیدی است. بنابراین انتخاب مجموعهای از ویژگیها که بتواند داده را به خوبی ارائه و نمایندگی کند، یک مساله مههم در تجزیه و تحلیل و پردازش این دادهها است. به این ترتیب، با حرف اطلاعات غیرمفید و نویز، یا ماهش همبستگی بین داده ها انتظار میرود دقت طبقهبندی افزایش یابد. تاکنون روشهای متفاوتی برای انتخاب ویژگی ارائه شده است. با این وجود این روشها هنگامیکه فضای ویژگی محدود است، میتوانند عملکرد مناسبی داشته باشند. اما ابعاد بسیار بالای ویژگیها در تصاویر فراطیفی استفاده از چنین روشهایی را با محدودیت روبهرو میکند. بنابراین در سالهای اخیر به کارگیری روشهای نوین و الگوریتمهای جستجوی تصادفی مانند الگوریتم ژنتیک، برای انتخاب ویژگی در تصاویر فراطیفی بیشتر مورد توجه قرار گرفته است. الگوریتم ژنتیک از روش تکامل بر مبنای اصل «بقای بهترین» بهره میگیرد. این شیوه یک روش کارآمد و سریع بهینهسازی در مسائل مختلف مهندسی است و به صورت گستردهای در حل مسائل پیچیده بهینهسازی بهکار برده میشود، انتخاب ویژگیهای بهینه در تصاویر فراطیفی میتواند نمونه خوبی برای این مسائل باشد. الگوریتم ژنتیک چون یکی از روشهای بهینهسازی برمبنای محاسبات هوشمند است میتواند رسیدن به جواب بهینه را تسهیل کند. الگوریتم طبقهبندی ماشینهای بردار پشتیبان یکی از روشهای نوین طبقهبندی است، که به دلیل عملکرد بسیار خوب آن در دادههای فراطیفی در سالهای اخیر مورد استقبال قرار گرفته است. با وجود مزایای زیادی که این الگوریتم دارد بازهم پدیده هیوز در آن رخ داده و منجر به کاهش دقت طبقه بندی می شود. به خصوص هنگامی که تعداد داده های آموزشی کم است ( 8 پیکسل برای هر کلاس) دقت طبقه بندی با استفاده از روش Wrapper به صورت میانگین 30% ، با استفاده از روش Filter به صورت میانگین 17% و با استفاده از داده های آموزشی 100 پیکسل برای هر کلاس دقت طبقه بندی در روش Wrapper به صورت میانگین 18% ، و در روش Filter به صورت میانگین 12% افزایش می دهند در حالیکه ابعاد داده به صورت قابل توجهی کاهش می یابند. این نتایج به خوبی کارایی روش انتخاب ویژگی را نشان می دهد.
- Abstract
- Hyperspectral remotely sensed data presents the excellent potential for information extraction of the earth surface because of their high spectral resolution. Therefore in recent years this remotely sensed imagery has been widely used for land cover mapping. Such high dimensionality of data provides more discrimination power in classification task, but also imposes high computational cost and complexity in data processing. In particular, because of inadequate number of training samples related to dimension of data, the proof of “curse of dimensionality” may occur. Therefore, as a necessary pre-processing step the data reduction techniques, are indispensable perform by feature selection. The feature selection techniques study how to select the most informative subset of features represents the data adequately that improve the prediction ability of classification by removing the redundant and irrelevant features. So far, various feature selection methods have been introduced, but most of them indicate some restriction in performance with high dimension data such as hyperspectral imagery. Thus, in the recent years the randomized heuristic search techniques such as Genetic Algorithm (GA) are more attractive for hyperspectral feature selection methods. Genetic algorithm is a general adaptive global optimization search method based on a direct analogy to Darwinian natural selection and genetics in biological systems. This algorithm is a fast and sufficient method to solve various complex engineering optimization problems. The Support Vector Machines is a new generation of classification system has been applied successfully in a range of problems including pattern recognition, bioinformatics, text classification, and image classification. Despite many advantages and some claims that the method is insensitive to the dimensionality of the data, it is shown that the accuracy of a classification may decline significantly with the addition of features, particularly if small training sample (8 pixels for each class) is used. In this case with wrapper and filter feature selection methods, classification accuracy increased 30% and 17% respectively. Additionally, it is demonstrated that, even when a large training sample (100 pixels for each class) is available, feature selection may still be useful. The results have shown 18% and 12% increase of classification accuracy with wrapper and filter method. In addition the significant decrease in feature subset is observed simultaneously. The results highlight the potential value of undertaking a feature selection analysis prior to classification.