عنوان پایان‌نامه

تصمیم گیری بهینه بهوسیله ترکیب احتمالی شواهد ویادگ



    دانشجو در تاریخ ۱۱ شهریور ۱۳۸۶ ، به راهنمایی ، پایان نامه با عنوان "تصمیم گیری بهینه بهوسیله ترکیب احتمالی شواهد ویادگ" را دفاع نموده است.


    محل دفاع
    کتابخانه دانشکده برق و کامپیوتر شماره ثبت: ٍٍE1297;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 35399
    تاریخ دفاع
    ۱۱ شهریور ۱۳۸۶

    سیستم های هوشمند به منظور تعامل با محیط اطراف خود به مرور پیچیده و پیچیده تر میشوند تنها راهی که یک سیستم هوشمند میتواند از محیط خود اطلاعات کسب کند استفاده از حسگرهای مختلف میباشد به همان صورتی که انسان حواس مختلف خودرا به کار میگیرد در دنیای هوش مصنوعی بخش اعظم تحقیقات در رابطه با یادگیری ماشین است که این خود حکایت از اهمیت موضوع دارد یادگیری ماشین به معنای هر فرایندی است که عملکرد خودرا در انجام وظیفه محوله نسبت به یک معیار خاص با استفاده از داده های دریافتی و پردازش انها بهبود بخشد. از نمونه های معروف این دسته روش ها می توان به یادگیری تحت سرپرستی , یادگیری بدون نظارت, یادگیری تقویتی و یادگیری بیزی اشاره کرد. مدل سازی و بازنمایی دانش در حضور عدم قطعیت همواره دشوار بوده است. مدل های گرافیکی رو ش مناسبی برای برخورد با این عدم قطعیت می باشد, و شبکه های بیزی با متغیر مخفی, در این چارچوب, روشی برای مجردسازی دانش فراهم می آورد.هم اکنون شواهدی از طریق آزمون های بالینی در دست است که نشان دهنده تصمیم گیری انسان بوسیله مفهوم سازی می باشد و تصمیم های او از چاچوب بیزی تبعیت می کند. در این پایان نامه قصد بر ترکیب شواهد و دانش, با تجربات به صورت غیر قطعی و با رویکردی احتمالی می باشد. در اینجا شواهد و یادگیری به معنای خاصی استفاده شده اند و منظور از شواهد هر دانشی می باشد که عامل به صورت مستقیم و با عملکرد خود (یادگیری) کسب نکرده باشد. در نهایت کارایی این روش به وسیله آزمون های شبیه سازی شده مانند هدایت روبات متحرکی بررسی می شود.روش هایی مانند یادگیری تقویتی هنگام روبرو شدن با مسائل پیچیده از کارایی مناسبی برخوردار نیستند و به این دلیل برای سرعت بخشیدن به روند یادگیری روش های یاگیری تقلیدی به تازگی به وجود آمدند.اما در بیشتر آنها شرایط محدود کننده ای وجود دارد و همچنین اصل تجربه را از یاد برده اند. بدین دلیل در این پایان نامه روشی برای یادگیری به گونه ای که تعادلی میان دانش کسب شده از طریق تجربه و شواهد برقرار شود ایجاد شده است. سپس با یادگیری و فشرده سازی اطلاعات در سطوح بالاتر , ;که در اینجا به نام مفاهیم از آنها یاد می شود, به ایجاد الگوریتمی ترتیبی برای افزودن تطبیق پذیری پرداخته شده است.این الگوریتم از پیشرفت های اخیر در تئوری اطلاعات برای یادگیری شبکه های بیزی با متغیر مخفی بهره می گیرد.
    Abstract
    Intelligent systems become more and more complex to be able to interact with their environment . The only way that an intelligent system can obtain information about is to use its various sensors, as human beings weild their different senses. In the world aritificial intelligence most of the research is on machine learning, which improves its functionality based on a specific criterion and the given data. Broadly speaking, machine learning can be categorized to supervised learning unsupervised learning and Bayesian approaches.Repesenting and modeling knowledge in the face of uncertainity has always been a challenge in artificial intelligence. Graphical models are in apt way of representing uncertainty , and hidden variables in this framework are a way abstraction of the knowledge. There are already some evidence by empricial study with human subjects that humans from concepts and Bayesianmodeling is closely related to concept learning in humans. In this research we strive to combine evidence with experience in an underterministic and probabilistic way. Here, evidence and learning is interpreted in a specific sense, that is by evidence we mean any information that the agent does not gather on its own (by learning). Finally, the proposed model is tested in navigation of mobile reboots. Reinforcement learning methods cannot learn gracefully or rapidly when facing tasks of high state space dimensionality, and imitiative has been created to alleviate this problem. However most of these learning paradigms have restrictive constraints and sometimes foreget the experience factor. Therefore, in this research a framework toprobabilistically combine evidence and learning is proposed. A sequential algorithm is then developed to compress and abstractions of information, herein called concepts, to make and adaptive and intelligent situated agent. The proposed algorithm employs advancement in learning hidden variable networks for the batch case, and utilize a mixture of approaches that allows for sequential learning of parameters and structure of the network.