عنوان پایان‌نامه

طراحی ساختار عامل مفهوم گرا برای یادگیری به کمک مربی



    دانشجو در تاریخ ۲۳ تیر ۱۳۸۸ ، به راهنمایی ، پایان نامه با عنوان "طراحی ساختار عامل مفهوم گرا برای یادگیری به کمک مربی" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 41582;کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E 1594
    تاریخ دفاع
    ۲۳ تیر ۱۳۸۸

    چکیده هدف از انجام این پایان‌نامه، ارائه یک چهارچوب نظری است که به بیان چگونگی تقلید از یک مربی می‌پردازد. چهارچوب حاضر توانایی تعمیم‌دهندگی نیز دارد. بدین معنا که با تغییر در شرایط اولیه، همچنان عامل می‌تواند از آموخته‌های خود بهره ببرد و در وظیفه آموخته شده به نتایجی مشابه با نتایج مربی دست یابد. روش ارائه شده بر پایه ایده مفهوم‌گرایی بنا نهاده شده است. در اینجا مفاهیم به روابط ریاضی اطلاق می‌شوند که به طور ثابت در طول یادگیری بین بخشی از مشاهدات عامل برقرار هستند. با استخراج روابط زمانی بین مفاهیم به‌دست آمده، سناریوی نهایی تقلید به‌دست می‌آید. چهارچوب مذکور به وسیله دو آزمایش مورد ارزیابی قرار گرفته است. در اولین آزمایش، عامل، یک ربات متحرک ساده است که میبایست در یک محیط گسسته ماتریسی، اهداف مورد نظر مربی را فهمیده و اجرا نماید. دومین آزمایش در محیطی پیوسته انجام می‌پذیرد که در آن عامل می‌بایست وظایف گرفتن یک جعبه و قرار دادن آن در یک سبد را در قالب یک بازوی رباتیکی یاد گرفته و به انجام برساند. این آزمایش در دو حالت بدون نوفه و با نوفه انجام شده و بدین ترتیب تأثیرات ناشی از عدم دید کامل از مربی بر ساختار پیشنهادی مورد بررسی قرار گرفته است.
    Abstract
    Abstract In this dissertation, we propose a mathematical framework for imitating a mentor. In addition to this, it provides generalization in the learnt task. It means that even with different and unseen initial conditions, the agent can use its learning and produce the same effect as the teacher. This method is based on the idea of conceptualization. Here, concepts are mathematical relations which are valid between observatory data during all training episodes. By extracting the temporal relations between these concepts, the final scenario is constructed. This framework has been tested by two experiments. In the first experiment, a simple mobile robot should understand the goals of the mentor and perform them in a discrete space environment. In the second one which is a continues space environment, a manipulator should learn the task of grasping an object and putting it inside a basket. This experiment is performed in noisy and without noise conditions. Thus, the effects of obstacles in perceiving the teacher have been analyzed.