عنوان پایاننامه
استفاده از نظریه شواهد دمپستر - شافر در یادگیری سلسله مراتبی مفاهیم
- رشته تحصیلی
- مهندسی برق-کنترل
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 39175;کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E1490
- تاریخ دفاع
- ۰۳ مهر ۱۳۸۷
- دانشجو
- طاهر شهبازی میرزاحسنلو
- استاد راهنما
- مجید نیلی احمدآبادی, بابک نجاراعرابی
- چکیده
- چکیده مدلسازی عدم قطعیت در سیستم¬های یادگیری دنیای واقعی غالبا نه تنها باعث بهبود سرعت و کیفیت یادگیری می¬شود، مقاومت آن در مقابل اطلاعات ناکامل ادراکی و نایقینی در دانش کسب شده و نتیجه عمل را افزایش می¬دهد. یادگیری مفهوم به عنوان یکی از مسائل چالش¬انگیز یادگیری ماشینی، درگیر با صورت¬های مختلف نایقینی می¬باشد. هدف این تحقیق استفاده از مدلسازی نایقینی در نظریه شواهد دمپستر-شفر در یادگیری مفهوم و بررسی مزایای احتمالی یک چنین مدلسازی می¬باشد. قالب مدل انتقال باور(TBM) از این نظریه ساختار مناسبی برای چنین یادگیری فراهم می¬سازد. مدلی بر این اساس به منظور توسعه مفاهیم در قالب TBM ارائه شده مکانیزمی کلی برای یادگیری نموی برخط عامل¬های یادگیری تعاملی بر اساس تقویت طرح می¬شود. چگونگی مدیریت اطلاعات سنسوری مختلف از طریق مدلسازی قابلیت اطمینان سنسوری در قالب توابع باور بررسی شده و یادگیری آن بحث می¬شود. یادگیری مطلوبیت بر اساس تکلیف یا محیطی در طراحی عامل¬های خودکار یادگیری مفهوم به منظور فراهم آوردن امکان استفاده مجدد دانش بررسی شده بر این اساس توسعه¬ای از یادگیری Q به فضای پیوسته حالت در قالب توابع باور ارائه می¬گردد. صرف¬نظر از فراهم آوردن قالب یادگیری همزمان تابع مطلوبیت و تشکیل مفاهیم مجرد، به عنوان روش یادگیری تقویتی سازگاری بیشتری در مقابل شرایط عملی سیستم¬های یادگیری واقعی فراهم می¬آورد. توسعه آن به فضای پیوسته موتوری مدلی مناسب¬تر برای یادگیری تقویتی سیستم-های روباتیکی فراهم می¬سازد، آنگونه که در آزمایش¬هایی در یک روبات واقعی نشان داده می¬شود.
- Abstract
- Uncertainty modeling in the real world learning systems, not only improves the quality and speed of learning, but quite often makes it more robust against incomplete perceptual information and uncertainty in the acquired knowledge and effect of the exerted action. Concept learning as one of the most challenging machine learning problems is involved with sources pervaded with different facets of uncertainty. The goal of this research is to utilize uncertainty modeling of Dempster-Shafer theory of evidence in concept learning models and explore possible advantages of such modeling. Transferable Belief Model (TBM) interpretation of this theory provides an appropriate framework. Introducing a model to develop concepts in the TBM framework, a general mechanism for online incremental learning of reinforcement based interactive agents is designed. Managing different sensory information sources through modeling sensor reliabilities in the belief functions framework is analyzed and its learning is discussed. Based on considering learning task-dependent or environmental utilities in designing autonomous concept learning agents to provide them with knowledge reusability in this framework, an evidential extension of -learning to continuous state spaces is introduced. Apart from providing a framework for concurrent learning of utility function and formation of abstract concepts, as a reinforcement learning rule it benefits from being more compatible with the practical circumstances. Its extension to continuous motor spaces presents more appropriate characteristics for reinforcement learning of robotic systems as it is verified through experiments with a real robot.