عنوان پایاننامه
طراحی ساختار عامل مفهوم گرا برای یادگیری به کمک مربی
- رشته تحصیلی
- مهندسی کامپیوتر- هوش مصنوعی - رباتیک
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 41582;کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E 1594
- تاریخ دفاع
- ۲۳ تیر ۱۳۸۸
- دانشجو
- سامان امیرپورامرائی
- استاد راهنما
- مجید نیلی احمدآبادی, بابک نجاراعرابی
- چکیده
- چکیده هدف از انجام این پایاننامه، ارائه یک چهارچوب نظری است که به بیان چگونگی تقلید از یک مربی میپردازد. چهارچوب حاضر توانایی تعمیمدهندگی نیز دارد. بدین معنا که با تغییر در شرایط اولیه، همچنان عامل میتواند از آموختههای خود بهره ببرد و در وظیفه آموخته شده به نتایجی مشابه با نتایج مربی دست یابد. روش ارائه شده بر پایه ایده مفهومگرایی بنا نهاده شده است. در اینجا مفاهیم به روابط ریاضی اطلاق میشوند که به طور ثابت در طول یادگیری بین بخشی از مشاهدات عامل برقرار هستند. با استخراج روابط زمانی بین مفاهیم بهدست آمده، سناریوی نهایی تقلید بهدست میآید. چهارچوب مذکور به وسیله دو آزمایش مورد ارزیابی قرار گرفته است. در اولین آزمایش، عامل، یک ربات متحرک ساده است که میبایست در یک محیط گسسته ماتریسی، اهداف مورد نظر مربی را فهمیده و اجرا نماید. دومین آزمایش در محیطی پیوسته انجام میپذیرد که در آن عامل میبایست وظایف گرفتن یک جعبه و قرار دادن آن در یک سبد را در قالب یک بازوی رباتیکی یاد گرفته و به انجام برساند. این آزمایش در دو حالت بدون نوفه و با نوفه انجام شده و بدین ترتیب تأثیرات ناشی از عدم دید کامل از مربی بر ساختار پیشنهادی مورد بررسی قرار گرفته است.
- Abstract
- Abstract In this dissertation, we propose a mathematical framework for imitating a mentor. In addition to this, it provides generalization in the learnt task. It means that even with different and unseen initial conditions, the agent can use its learning and produce the same effect as the teacher. This method is based on the idea of conceptualization. Here, concepts are mathematical relations which are valid between observatory data during all training episodes. By extracting the temporal relations between these concepts, the final scenario is constructed. This framework has been tested by two experiments. In the first experiment, a simple mobile robot should understand the goals of the mentor and perform them in a discrete space environment. In the second one which is a continues space environment, a manipulator should learn the task of grasping an object and putting it inside a basket. This experiment is performed in noisy and without noise conditions. Thus, the effects of obstacles in perceiving the teacher have been analyzed.