عنوان پایان‌نامه

تعیین سیستم طبقه بندی کننده بهینه



    دانشجو در تاریخ ۳۰ بهمن ۱۳۸۹ ، به راهنمایی ، پایان نامه با عنوان "تعیین سیستم طبقه بندی کننده بهینه" را دفاع نموده است.


    محل دفاع
    کتابخانه پردیس 2 فنی شماره ثبت: 1964;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 49642
    تاریخ دفاع
    ۳۰ بهمن ۱۳۸۹
    استاد راهنما
    فرهاد صمدزادگان

    امروزه تصاویر سنجش از دور به عنوان یک منبع اطلاعاتی رقومی، در دسترس و مقرون به صرفه در کاربردهای گوناگونی مانند پیش بینی آب و هوا، زمین شناسی و کشاورزی مورد استفاده قرار گرفته اند. با گسترده شدن کاربردهای تصاویر سنجش از دور و پیشرفت های وسیعی در زمینه تکنولوژی ساخت سنجنده های فراطیفی در سنجش از دور، امکان اخذ تصاویر با صدها باند با قدرت تفکیک طیفی بالا فراهم شده است. از یکسو افزایش تعداد باندها و در نتیجه افزایش اطلاعات طیفی، امکان استخراج اطلاعات بیشتر در مورد عوارض موجود در تصویر و همچنین تمایز بین عوارض مشابه را فراهم می کند. از سوی دیگر با بالا رفتن ابعاد فضای ورودی، نیاز به پردازش های خاصی به منظور بکارگیری این تصاویر در بسیاری از کاربردهای مطرح می باشد. یک مرحله مهم در پردازش تصاویر فراطیفی به منظور استخراج اطلاعات و تهیه نقشه های موضوعی، طبقه بندی آنها به مجموعه ای از کلاس های از پیش تعیین شده می باشد. در تصاویر فراطیفی، طبقه بندی کننده های پارامتریک به علت نیاز به تخمین توزیع آماری کلاس ها و عدم توازن بین تعداد باندها و تعداد نمونه های آموزشی، با پدیده هیوز مواجه می شوند. در این شرایط به علت بزرگ شدن فضای فرضیه و محدودیت تعداد نمونه های آموزشی، احتمال بیش تطابق نمودن مدل به داده های آموزشی وجود دارد. به منظور رفع مشکلات طبقه بندی کننده های پارامتریک در سال های اخیر طبقه بندی کننده های غیر پارامتریک مختلفی به منظور طبقه بندی تصاویر فراطیفی ارائه شده اند، از جمله: شبکه عصبی، درخت تصمیم گیری و روش های کرنل مبنا. در این زمینه ماشین های بردار پشتیبان به عنوان یک روش کرنل مبنا، توانسته اند با توجه به عملکردشان بر مبنای ویژگی های هندسی و عدم نیاز به تخمین ویژگی های آماری، ابزاری بسیار کارآ و قدرتمند برای طبقه بندی تصاویر فراطیفی به حساب آیند. ایده ماشین های بردار پشتیبان یافتن یک صفحه تصمیم گیری بهینه به منظور جداسازی دو کلاس می باشد به صورتیکه دارای بیشترین حاشیه جداسازی را بین دو کلاس داشته باشد. در صورتیکه نمونه ها به صورت خطی جداپذیر نباشند، ابتدا با یک کرنل به فضایی با ابعاد بالاتر منتقل شده و صفحه جداکننده در آن فضا تعریف می شود. هر چند در سال های اخیر ماشین های بردار پشتیبان با موفقیت در طبقه بندی بسیاری از تصاویر فراطیفی به کار گرفته شده اند، با این حال می بایست به تاثیر دو عامل که بر عملکرد آنها تاثیرگذار هستند، توجه داشت: پارامترهای ماشین های بردار پشتیبان و فضای ویژگی ورودی (باندهای ورودی طبقه بندی). به منظور طراحی یک سیستم طبقه بندی بهینه برای تصاویر فراطیفی بر مبنای ماشین های بردار پشتیبان، انتخاب مقادیر بهینه پارامترهای مدل و انتخاب زیر مجموعه ای از باندهای بهینه چالش هایی است که در این زمینه وجود دارند. به علت اهمیت موضوع، مطالعات زیادی در سال های اخیر در زمینه بهینه سازی طبقه بندی داده های با ابعاد بالا بر مبنای ماشین های بردار پشتیبان انجام شده است که می توان آنها را به سه دسته تقسیم کرد. در دسته اول، از همه ویژگی های ورودی داده استفاده می شود و پارامترهای مدل بهینه می گردد تا کارآیی ماشین های بردار پشتیبان بالا رود. انتخاب ویژگی های بهینه با ثابت در نظر گرفتن پارامترها گروه دوم تحقیقات می باشد که با حذف ویژگی های اضافی و وابسته، دقت و سرعت طبقه بندی را بهبود می بخشند. در این دسته از مطالعات، در ابتدا مقادیر پارامترهای مدل با استفاده از یک روش کلاسیک محاسبه شده و یا از مقادیر پیش فرض استفاده می کنند. سپس در مرحله انتخاب ویژگی، مقادیر پارامترهای مدل ثابت در نظر گرفته خواهند شد. با توجه به تاثیر فضای ورودی بر مقدار بهینه پارامترها و بالعکس، دسته سوم الگوریتم ها به حل همزمان تعیین پارامترها و انتخاب زیر مجموعه ویژگی های بهینه می پردازند. هدف در این تحقیق، ارزیابی تاثیر هر یک از عوامل مذکور بر عملکرد طبقه بندی تصاویر فراطیفی و تعیین مقادیر بهینه آن ها می باشد. با توجه به بزرگ بودن ابعاد فضای باندهای تصاویر فراطیفی و در نتیجه بزرگ شدن فضای جستجو نیاز به یک الگوریتم بهینه سازی قوی و کارآ می باشد تا بتواند جواب بهینه سراسری را تعیین کند. از آنجائیکه الگوریتم های بهینه سازی کلاسیک معمولا در فضای جستجوی بزرگ با مشکل مواجه شده و به جواب زیر بهینه می رسند، در این تحقیق از الگوریتم های بهینه سازی فراابتکاری استفاده گردیده است. الگوریتم های فراابتکاری به علت اجرای همزمان جستجوی سراسری و جستجوی محلی و همچنین ماهیت تصادفی بودن آن ها دارای پتانسیل بالا در حل مسائل پیچیده بهینه سازی می باشند. در این تحقیق توانایی الگوریتم های فراابتکاری در تعیین طبقه بندی کننده های بردار پشتیبان در سه رویکرد: تعیین مقادیر بهینه پارامترهای ماشین های بردار پشتیبان، انتخاب زیرمجموعه ویژگی های بهینه و حل همزمان هر دو مفهوم در طبقه بندی تصاویر فراطیفی مورد ارزیابی قرار گرفته است. الگوریتم های فراابتکاری را می توان بر اساس تعداد عوامل جستجوگر به دو دسته مسیرمبنا و جمعیت مبنا تقسیم نمود. الگوریتم شبیه سازی تبرید تدریجی از الگوریتم های مسیرمبنا با یک عامل جستجوگر و الگوریتم ژنتیک و الگوریتم های خردجمعی از گروه الگوریتم های جمعیت مبنا در این تحقیق مورد ارزیابی قرار گرفتند.
    Abstract
    Hyperspectral remote sensing imagery due to its rich source of spectral information provides an efficient tool for land cover classifications in complex geographical areas. However high dimension space of this imagery imposes two important challenges in classification process: Hughes phenomena and existence relevant and redundant features. Referring to robustness of Support Vector Machines (SVMs) in high dimensional space, they are efficient tool for classification of hyperspectral imagery. However, there are two optimization issues which have strong effect on the SVMs performance: optimum SVMs parameters determination and optimum feature subset selection. During last years, several algorithms proposed to determine optimum values of SVMs parameters, called model selection. Grid search is a conventional method in model selection which evaluates possible sets of parameters and selects the best one with the highest potential. Obviously in continues space, accurate model selection achieved by high resolution grid and algorithm become more time consuming. Due to restriction of grid search, advanced methods are proposed to overcome limitation of this method. Optimum feature selection is another essential process in classification of high dimensional dataset which choose optimum combination of feature to have suitable classification. By extracting as much information as possible from a given dataset while using the smallest number of features, significant computation time can be saved and models with better generalization ability for unseen data points are built. Selected features may affects several pattern classification aspects, including classification accuracy, time, training sample size, and the cost associated with the features. As traditional optimization algorithms usually trap in local optimum in this high dimensional space, it is inevitable to apply meta-heuristic optimization algorithms such as Ant Colony Optimization (ACO), Particle Swarm Optimization (PSO) and Bees Algorithm (BA) to obtain near global optimum solution. We evaluate the potential of three optimization situations in determining of SVMs parameters and feature subset selection based on different meta-heuristic optimization algorithms. These situations are 1- Classification Based on Dynamic SVMs Classifiers and Fixed Features, 2- Classification Based on Fixed SVM Classifier and Dynamic Features and 3- Classification Based on Dynamic SVM Classifier and Dynamic Feature. Obtained results on AVIRIS hyperspectral imagery demonstrate superior performance of SVMs achieved by simultaneously optimization of SVMs parameters and input feature subset.