عنوان پایاننامه
ارائهی یک چارچوب یادگیری برای ترکیب کنترل توجه مبتنی بر مکان و مبتنی بر شئ
- رشته تحصیلی
- مهندسی کامپیوتر-هوش مصنوعی- رباتیک
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2243;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 58171
- تاریخ دفاع
- ۱۳ خرداد ۱۳۹۲
- دانشجو
- زهرا ایمان
- استاد راهنما
- مجید نیلی احمدآبادی, بابک نجاراعرابی
- چکیده
- توجه دیداری، مکانیزمی که توسط آن اطلاعات مهمتر به جای تمامی اطلاعات مورد پردازش قرار میگیرند، به دو دستهی کلی تقسیم شده است: توجه مبتنی بر شیء و توجه مبتنی بر مکان. توجه مبتنی بر شیء سعی میکند اشیایی را انتخاب نماید که از اهمیت بیشتری برخوردار هستند، در حالیکه توجه مبتنی بر مکان بر روی مکانهای مهمتر و برجستهتر تمرکز مینماید. هدف از پژوهش ارائه شده، بررسی تاثیر هر یک از دو نوع توجه فوق در یک وظیفهی تعریف شده و ارائهی یک چارچوب مناسب به منظور ترکیب این دو توجه است. بنابراین، با در نظر گرفتن اشیاء به عنوان اجزاء یک صحنهی داخلی که بطور معمول شامل تعداد بالایی از اشیاء است، سعی میشود که کلاس صحنهی مورد نظر تخمین زده شود. اشیاء فوق روابط مکانی متفاوتی با یکدیگر میتوانند داشته باشند. در این پژوهش، دو روش مختلف ارائه میشود. روش اول به بررسی تاثیر یک روش مبتنی بر شیء میپردازد. این روش سعی میکند که با انتخاب یک شیء که بیشترین اطلاع را در مورد دستهی صحنه میتواند به همراه آورد، با کمترین تعداد مشاهدات ممکن، کلاس صحنهی موردنظر را تخمین بزند. روش دوم به منظور ترکیب مناسب دو نوع توجه مبتنی بر شیء و مبتنی بر مکان ارائه میشود. در این راستا، فرایند جستجوی کلی در تصویر یک فرایند مبتنی بر مکان بوده و در هر گام سعی میکند مهمترین مکان بعدی را انتخاب نماید. این در حالی است که خود فرایند انتخاب بهترین مکان مبتنی بر شیء بوده و بر اساس مجموعه اشیایی که در هر یک از ناحیههای تصویر واقع میشوند و میزان مناسببودن آنها، تصمیمگیری میکند. همچنین، در روش ارائه شده از روابط مکانی بین اشیاء مختلف استفاده میشود. نتایج آزمایشها نشان میدهند که ترکیب دو روش فوق و استفاده از روابط مکانی میتواند دقت و سرعت تشخیص کلاس صحنه را در صورت وجود محدودیت بالا بهبود بخشد.
- Abstract
- Visual attention is definded as the mechanism for selecting and processing the most important parts of data instead of processing all information. This process is classified into two categories: object-based attention and space-based attention. Object-based attention tries to select the most important objects, while space-based attention selects the most salient regions of space. The goal of this research is to evaluate the effects of each one of them in a specified task and to develope a framework for the purpose of integrating these two methods. Therefore, objects are considered as parts of an indoor scene which usually contains different objects. The proposed method tries to predict the scene class of such an indoor scene. Different objects in the scene can have different spatial relationships. In this research two different approaches have been introduced. The first one is concerned with evaluating the contribution of an object-based method. It tries to predict class of the scene by minimum number of object observations using the selection of the most informative object at each step. The second proposed method tries to integrate object-based and space-based attention. In this way, the search process is space-based and tries to select the most informative location in the next step. But, the selection itself is object-based. It is based on the goodness related to the set of objects that can be observed in each location. Also, relative location of objects has been used in this method. Results show that the integration of the two and use of relative location of objects can improve the speed and accuracy of correct classification rate of scenes.