طبفه بندی تصا ویر فرا طیفی با استفاده از الگوریتم جنگل تصادفی
- رشته تحصیلی
- مهندسی عمران- نقشه برداری- سنجش ازدور
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: 2694;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 64247
- تاریخ دفاع
- ۲۷ مرداد ۱۳۹۳
- دانشجو
- سعید امینی
- استاد راهنما
- عبدالرضا صفری
- چکیده
- الگوریتم جنگل تصادفی یکی از روشهای نوینی است که به منظور طبقهبندی تصاویر سنجش از دور فراطیفی ارائه شده است. استفاده از این الگوریتم به دلیل نتایج رضایتبخش، سرعت بالا و نیز پارامترهای کم برای تنظیم به منظور طبقهبندی در حال افزایش است. این الگوریتم یکی از روشهای طبقهبندی کننده جمعی است و از مجموعهای از طبقهبندی کنندههای درختی شکل تشکیل شده است. این الگوریتم برای آموزش از چندین طبقهبندی کننده و تلفیق نتایج آنها با استفاده از رأیگیری و یافتن محبوبترین کلاس به منظور تصمیمگیری نهایی و انجام طبقهبندی استفاده میکند. به منظور پیادهسازی این الگوریتم، پس از معرفی پارامترهای مورد نیاز برای هر کدام از درختان، از میان دادههای آموزشی نمونهبرداری کرده و از سایر نمونهها در مرحله آخر به منظور محاسبه خطای خارج از کیسه استفاده میشود. این خطا با استفاده از درصدی از دادههای آموزشی که در آموزش شبکه استفاده نشدهاند محاسبه میشود. پس از نمونهبرداری از دادههای آموزشی از میان ویژگیهای ورودی به تصادف تعدادی را انتخاب نموده و با استفاده از شرط جینی و یا حداکثر اطلاعات استخراجی بهترین ویژگی را انتخاب نموده و به همین ترتیب تا رسیدن به شرط توقف به کار خود ادامه میدهد. در آخر، به منظور تصمیمگیری از رأی اکثریت بر روی نتایج حاصل از درختان میپردازد. در این پایاننامه الگورریتم جنگل تصادفی به سه شکل پیاده سازی و ارزیابی شد: در ابتدا به صورت استاندارد، سپس برای بهرهبرداری از اطلاعات مکانی-فضایی در تصاویر به صورت شیءمبنا و در آخر الگوریتم به صورت نیمه نظارتشده به منظور بهبود دقت طبقهبندی در مواقعی که داده آموزشی کمی در اختیار است. الگوریتمهای استاندارد و پیشنهادی در این پایاننامه بر روی دادههای فراطیفی حاصل از سنجندههای مختلف در مناطق شهری و کشاورزی اعمال شد. نتایج حاصل از این پژوهش نشان داد که الگوریتم جنگل تصادفی قادر به اخذ نتایج رضایتبخشی بر روی دادههای تصویری فراطیفی است. دقت کلی این الگوریتم در مناطق شهری و کشاورزی به ترتیب برابر 76.57 و 87.92 درصد و ضریب کاپا نیز برابر 0.74 و 0.86 شد. واژههای کلیدی: طبقهبندی، تصاویر فراطیفی، الگوریتم جنگل تصادفی، ویژگی، روشهای آموزش جمعی
- Abstract
- Hyperspectral imaging is one of the most powerful earth observation tools for identifying and mapping of earth’s surface phenomena. The hyperspectral sensors can acquire hundreds of contiguous spectral channels and various useful information can be extracted from this data. Classification methods, either supervised or unsupervised are the most important tools for extracting the information from hyperspectral image. In supervised classification, large numbers of training data is needed. In addition, the accuracy of classification depends on the quality and quantity of this data. Meanwhile, collecting the reference data is a difficult, expensive and time-consuming task. Unsupervised classification or clustering is proposed to resolve the problem of training data requirement. The clusters can be extracted image without any a priori knowledge. The problem with this methods is that any information about relation between clusters and classes is not ensured. Random Forest classifier has been recently proposed for hyperspectral image classification and has raised much interest, thanks to its speed of processing and needs of a few parameters to be set. This classifier is an ensemble classification method that comprising a collection of treelike classifiers, which train several classifiers and combine their results through a voting process. The classifier uses a large number of individual decision trees and classification performs by majority voting on these trees for finding the most popular class. RF classifier has two main characteristics: the relatively high accuracy and the speed of processing. However, the correlation/independence of trees can affect the accuracy of final land-cover map. To overcome this issue, one should use the specific measures, which are able to consider this spatial/spectral correlation among the trees. . These algorithms are evaluated by different validity indices on two hyperspectral benchmark dataset: Eastern Peatland and Baden datasets. The implementation of algorithms showed that we could use Random Forest algorithm for hyperspectral data classification and acquise proper result. However, this algorithm is still needs for works for improvement and by working on this algorithm, we can take better outpus. Keywords: Classification, Hyperspectral Image, Random Forest, Feature, Ensemble Learning Method