عنوان پایان‌نامه

طبفه بندی تصا ویر فرا طیفی با استفاده از الگوریتم جنگل تصادفی



    دانشجو در تاریخ ۲۷ مرداد ۱۳۹۳ ، به راهنمایی ، پایان نامه با عنوان "طبفه بندی تصا ویر فرا طیفی با استفاده از الگوریتم جنگل تصادفی" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: 2694;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 64247
    تاریخ دفاع
    ۲۷ مرداد ۱۳۹۳
    دانشجو
    سعید امینی
    استاد راهنما
    عبدالرضا صفری

    الگوریتم جنگل تصادفی یکی از روش‌های نوینی است که به منظور طبقه‌بندی تصاویر سنجش از دور فرا‌طیفی ارائه شده است. استفاده از این الگوریتم به دلیل نتایج رضایت‌بخش، سرعت بالا و نیز پارامتر‌های کم برای تنظیم به منظور طبقه‌بندی در حال افزایش است. این الگوریتم یکی از روش‌های طبقه‌بندی کننده جمعی است و از مجموعه‌ای از طبقه‌بندی کننده‌های درختی شکل تشکیل شده است. این الگوریتم برای آموزش از چندین طبقه‌بندی کننده و تلفیق نتایج آن‌ها با استفاده از رأی‌گیری و یافتن محبوب‌ترین کلاس به منظور تصمیم‌گیری نهایی و انجام طبقه‌بندی استفاده می‌کند. به منظور پیاده‌سازی این الگوریتم، پس از معرفی پارامترهای مورد نیاز برای هر کدام از درختان، از میان داده‌های آموزشی نمونه‌برداری کرده و از سایر نمونه‌ها در مرحله آخر به منظور محاسبه خطای خارج از کیسه استفاده می‌شود. این خطا با استفاده از درصدی از داده‌های آموزشی که در آموزش شبکه استفاده نشده‎اند محاسبه می‌شود. پس از نمونه‌برداری از داده‌های آموزشی از میان ویژگی‌های ورودی به تصادف تعدادی را انتخاب نموده و با استفاده از شرط جینی و یا حداکثر اطلاعات استخراجی بهترین ویژگی را انتخاب نموده و به همین ترتیب تا رسیدن به شرط توقف به کار خود ادامه می‌دهد. در آخر، به منظور تصمیم‌گیری از رأی اکثریت بر روی نتایج حاصل از درختان می‌پردازد. در این پایان‏نامه الگورریتم جنگل تصادفی به سه شکل پیاده سازی و ارزیابی شد: در ابتدا به صورت استاندارد، سپس برای بهره‎برداری از اطلاعات مکانی-فضایی در تصاویر به صورت شیءمبنا و در آخر الگوریتم به صورت نیمه نظارت‌شده به منظور بهبود دقت طبقه‌بندی در مواقعی که داده آموزشی کمی در اختیار است. الگوریتم‏های استاندارد و پیشنهادی در این پایان‎نامه بر روی داده‌های فرا‌طیفی حاصل از سنجنده‌های مختلف در مناطق شهری و کشاورزی اعمال شد. نتایج حاصل از این پژوهش نشان داد که الگوریتم جنگل تصادفی قادر به اخذ نتایج رضایت‌بخشی بر روی داده‎های تصویری فرا‌طیفی است. دقت کلی این الگوریتم در مناطق شهری و کشاورزی به ترتیب برابر 76.57 و 87.92 درصد و ضریب کاپا نیز برابر 0.74 و 0.86 شد. واژه‌های کلیدی: طبقه‌بندی، تصاویر فرا‌طیفی، الگوریتم جنگل تصادفی، ویژگی، روش‌های آموزش جمعی
    Abstract
    Hyperspectral imaging is one of the most powerful earth observation tools for identifying and mapping of earth’s surface phenomena. The hyperspectral sensors can acquire hundreds of contiguous spectral channels and various useful information can be extracted from this data. Classification methods, either supervised or unsupervised are the most important tools for extracting the information from hyperspectral image. In supervised classification, large numbers of training data is needed. In addition, the accuracy of classification depends on the quality and quantity of this data. Meanwhile, collecting the reference data is a difficult, expensive and time-consuming task. Unsupervised classification or clustering is proposed to resolve the problem of training data requirement. The clusters can be extracted image without any a priori knowledge. The problem with this methods is that any information about relation between clusters and classes is not ensured. Random Forest classifier has been recently proposed for hyperspectral image classification and has raised much interest, thanks to its speed of processing and needs of a few parameters to be set. This classifier is an ensemble classification method that comprising a collection of treelike classifiers, which train several classifiers and combine their results through a voting process. The classifier uses a large number of individual decision trees and classification performs by majority voting on these trees for finding the most popular class. RF classifier has two main characteristics: the relatively high accuracy and the speed of processing. However, the correlation/independence of trees can affect the accuracy of final land-cover map. To overcome this issue, one should use the specific measures, which are able to consider this spatial/spectral correlation among the trees. . These algorithms are evaluated by different validity indices on two hyperspectral benchmark dataset: Eastern Peatland and Baden datasets. The implementation of algorithms showed that we could use Random Forest algorithm for hyperspectral data classification and acquise proper result. However, this algorithm is still needs for works for improvement and by working on this algorithm, we can take better outpus. Keywords: Classification, Hyperspectral Image, Random Forest, Feature, Ensemble Learning Method