عنوان پایاننامه
یادگیری تقویتی مفاهیم با استفاده از اطلاعات چند گانه سنسوری
- رشته تحصیلی
- مهندسی کامپیوتر-هوش مصنوعی- رباتیک
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E1429;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 1429
- تاریخ دفاع
- ۱۳ اسفند ۱۳۸۶
- دانشجو
- هادی فیروزی
- استاد راهنما
- مجید نیلی احمدآبادی, بابک نجاراعرابی
- چکیده
- موجودات هوشمند به منظور مدیریت حجم عظیم دادههایی که به عنوان ورودیهای حسی دریافت میکنند بایستی که توانایی مجردسازی این اطلاعات را داشته باشند. مجردسازی در واقع علاوه بر قدرت تعمیم، امکان انتقال آسان دانش بین عاملهایی که در محیط واقعی قرار دارند را نیز فرآهم میآورد. یادگیری مفاهیم یک روش برای مجردسازی است که در آن فضاهای پیوسته حسی و حرکتی عامل به موجودیتهای گسستهای به نام "مفهوم" نگاشته میشوند. در میان مدلهای محاسباتی مختلف برای یادگیری مفاهیم در هوش مصنوعی، روشهایی که بر مبنای یادگیری تقویتی طراحی شدهاند به دلیل کاربردشان در مسائل واقعی از محبوبیت بیشتری برخوردارند. در واقع در این پایاننامه یک روش احتمالاتی الهام گرفته شده از طبیعت برای یادگیری مفاهیم مبتنی بر اعمال عامل ارائه شده است. این روش با بهرهگرفتن از ایده موجود در نرونهای آیینهای و توسعه دادن آن، میکوشد تا یک مسئله یادگیری تقویتی را در یک محیط پیوسته غیر قطعی حل نماید. همچنین در عوض تولید حجم عظیمی از اطلاعات عددی، در این روش با بهرهگرفتن از سیگنال پاداش دریافتی از محیط، مفاهیم بصورت تدریجی یادگیری میشوند. علاوه بر این به منظور مقابله با نویز و نایقینی موجود در اطلاعات دریافتی از محیط و پویایی موجود در مسائل واقعی و بهرهمندی از قابلیت تعمیم در حل مسائل، از یک چارچوب احتمالاتی استفاده شده است. با در نظر گرفتن خصوصیات مطرح شده، تفاوت عمده روش پیشنهادی با یک الگوریتم دستهبندی یا خوشهبندی و یا یادگیری تقویتی معمولی مشخص میشود.