عنوان پایان‌نامه

یادگیری تقویتی مفاهیم با استفاده از اطلاعات چند گانه سنسوری



    دانشجو در تاریخ ۱۳ اسفند ۱۳۸۶ ، به راهنمایی ، پایان نامه با عنوان "یادگیری تقویتی مفاهیم با استفاده از اطلاعات چند گانه سنسوری" را دفاع نموده است.


    محل دفاع
    کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E1429;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 1429
    تاریخ دفاع
    ۱۳ اسفند ۱۳۸۶

    موجودات هوشمند به منظور مدیریت حجم عظیم داده‌هایی که به عنوان ورودی‌های حسی دریافت می‌کنند بایستی که توانایی مجردسازی این اطلاعات را داشته باشند. مجردسازی در واقع علاوه بر قدرت تعمیم، امکان انتقال آسان دانش بین عامل‌هایی که در محیط واقعی قرار دارند را نیز فرآهم می‌آورد. یادگیری مفاهیم یک روش برای مجردسازی است که در آن فضاهای پیوسته حسی و حرکتی عامل به موجودیت‌های گسسته‌ای به نام "مفهوم" نگاشته می‌شوند. در میان مدل‌‌های محاسباتی مختلف برای یادگیری مفاهیم در هوش مصنوعی، روش‌هایی که بر مبنای یادگیری تقویتی طراحی شده‌اند به دلیل کاربردشان در مسائل واقعی از محبوبیت بیشتری برخوردارند. در واقع در این پایان‌نامه یک روش احتمالاتی الهام گرفته شده از طبیعت برای یادگیری مفاهیم مبتنی بر اعمال عامل ارائه شده است. این روش با بهره‌گرفتن از ایده موجود در نرون‌های آیینه‌ای و توسعه دادن آن، می‌کوشد تا یک مسئله یادگیری تقویتی را در یک محیط پیوسته غیر قطعی حل نماید. همچنین در عوض تولید حجم عظیمی از اطلاعات عددی، در این روش با بهره‌گرفتن از سیگنال پاداش دریافتی از محیط، مفاهیم بصورت تدریجی یادگیری می‌شوند. علاوه بر این به منظور مقابله با نویز و نایقینی موجود در اطلاعات دریافتی از محیط و پویایی موجود در مسائل واقعی و بهره‌مندی از قابلیت تعمیم در حل مسائل، از یک چارچوب احتمالاتی استفاده شده است. با در نظر گرفتن خصوصیات مطرح شده، تفاوت عمده روش پیشنهادی با یک الگوریتم دسته‌بندی یا خوشه‌بندی و یا یادگیری تقویتی معمولی مشخص می‌شود.