عنوان پایان‌نامه

یادگیری کنترل توجه در یادگیری مفاهیم در محیط های پیچیده



    دانشجو در تاریخ ۱۳ مهر ۱۳۸۷ ، به راهنمایی ، پایان نامه با عنوان "یادگیری کنترل توجه در یادگیری مفاهیم در محیط های پیچیده" را دفاع نموده است.


    رشته تحصیلی
    مهندسی برق‌-کنترل‌
    مقطع تحصیلی
    کارشناسی ارشد
    محل دفاع
    کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 39569;کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E1451
    تاریخ دفاع
    ۱۳ مهر ۱۳۸۷

    چکیده عامل‌های هوشمند، چه طبیعی و چه مصنوعی، از طریق مجموعه حسگرهای خود از محیط بیرون خود کسب اطلاعات می‌کنند. برای تعامل موثر با محیط بایستی این عامل‌ها توانایی پردازش این اطلاعات در زمان واقعی را داشته باشند. اما به طور معمول حجم عظیم اطلاعات حسگری، محاسبات مربوط به یادگیری ماشین را غیرقابل ردیابی می‌کند. از طرف دیگر در موارد بسیار زیادی بخشی از اطلاعات ورودی گمراه کننده هستند که بایستی این موضوع تشخیص داده شود، به عنوان مثال هنگامی که قسمتی از جسمی که قرار است بازشناسی شود از دید عامل پوشیده شده باشد. یکی از راه‌های مقابله با چنین مسائلی یافتن استراتژیی برای کنترل توجه است. به این معنی که عامل فضای حسگری خود را، بر حسب درج? اهمیتی که در وظیف? جاری عامل ایفا می‌کند، تقسیم‌بندی کرده و این قسمتها را به نوبت و بر حسب درج? اهمیت، پردازش کند. به این ترتیب محاسبات، عملی و قابل ردیابی می‌شود. از آنجایی که پیاده‌سازی کنترل توجه به شدت وابسته به وظیفه است، در این پایان نامه بازشناخت چهره به عنوان وظیفه انتخاب شده است. در بازشناخت چهره لازم است بردارهایی با بعد زیاد مطالعه شوند. ابتدا تصاویر چهره، بلوک‌بندی شده و سپس یک ساختار یادگیری تقویتی ترتیب اهمیت بلوک‌ها رادر توانایی طبقه‌بندی به دست می‌آورد. حاصل، یک استراتژی کنترل توجه بود که بر طبق آن می‌توان با نگاه کردن به کم‌ترین تعداد بلوک‌ها وظیف? بازشناسی را به انجام رسانید. کارکرد مهم کنترل توجه این است که عامل، قسمت‌های مهم‌تر فضای حسگری را مورد بررسی قرار دهد. این امر موجب می‌شود عامل به تدریج یاد بگیرد که قسمت‌هایی از این فضا را که به طور نظام‌مند غیر قابل رویت است در تصمیم‌گیری‌های خود دخالت ندهد. به این ترتیب می‌توان به عملکردهایی بالاتر دست یافت. برای نشان دادنِ چنین نتیجه‌ای از بازشناسی چهره‌های دچار پوشیدگی استفاده شد. به این صورت که در یک آزمایش به عامل تصاویر ناپوشید? افرادی آموزش داده می‌شود و عامل بایستی چهر? این افراد را در حالتی که پوشیدگی‌هایی عارض شده بازشناسی کند. در آزمایش دیگر عامل با تصاویر پوشیده آموزش دیده و بایستی تصاویر بدون پوشش را بازشناسی کند. این آزمایش بر روی بانک تصاویر چهر? صورت پذیرفت و نتایج آن با نتایج روش متداولِ کلیت‌گرایانه مورد مقایسه قرار گرفت. در آزمایش اول روش پیشنهاد شده بهبودی بیش از 28 درصد و در آزمایش دوم بهبودی نزدیک 5 درصد، در مقایسه با روش کلیت‌گرایانه حاصل شد.
    Abstract
    Abstract An intelligent agent, either natural or artificial, gains information about the environment with its sensors. For an effective interaction with the environment it should process these data in real time. But the large amount of sensory data is a hindrance which makes the machine learning calculations intractable. One way of facing with such problem is finding an attention control strategy, i.e. the agent dissects its sensory space, and sorts them based on the importance of each section in its current task. In this way the calculations become more practical and tractable. Since the implementation of attention control is highly task-dependent, in this research face recognition is chosen as the task of interest. In this task handling long feature vectors is a necessity. First the faces are gridded into blocks, then a reinforcement learning (RL) agent learns the importance of each block in classification task. The result is a spatial attention control strategy whereby a face can be recognized by processing a few number of blocks. The main functionality of attention control is selecting the important parts of sensory space. So with attention control the agent gradually learns to reject those parts of sensory space which are systematically non-observable, resulting in higher performance. To justify this functionality the recognition performance over occluded faces is studied. For this purpose two experiments are carried out. In the first experiment the system is trained with occluded faces and is tested by recognizing non-occluded ones. In the second experiment the system is trained with non-occluded faces and afterwards it should recognize the occluded faces. These experiments are conducted on AR database and the results are compared with conventional holistic method. In the first and second experiments 28 and 5 percent improvements are made respectively.