عنوان پایان‌نامه

توسعه مدل محاسباتی Neocognitron جهت بازشناسی دست نوشته فارسی



    دانشجو در تاریخ ۰۸ بهمن ۱۳۹۳ ، به راهنمایی ، پایان نامه با عنوان "توسعه مدل محاسباتی Neocognitron جهت بازشناسی دست نوشته فارسی" را دفاع نموده است.


    رشته تحصیلی
    علوم کامپیوتر
    مقطع تحصیلی
    کارشناسی ارشد
    محل دفاع
    کتابخانه پردیس علوم شماره ثبت: 5557;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 66625
    تاریخ دفاع
    ۰۸ بهمن ۱۳۹۳
    استاد راهنما
    محمد گنج تابش

    وقتی شیءای را می‌بینیم، چه در مغز ما می‌گذرد؟ نحوه عملکرد سیستم بینایی ما چگونه است؟ شناسایی چهره یک فرد آشنا در محیطی شلوغ، خواندن تابلوی یک مغازه در یک روز برفی و از فاصله‌ای دور، خواندن متنی که فردی با دست‌خط بد نوشته است و ... تنها بخش کوچکی از توانایی‌های خارق‌العاده‌ی دستگاه بینایی انسان است که با سرعت و دقت بالایی توسط آن انجام می‌شود. بسیاری با ایده‌گیری از یافته‌های بیولوژیکی قشر بینایی مغز، سعی در مدل‌سازی این سیستم دارند. از همین رو مدل‌های محاسباتی بسیاری با تقلید از رفتارهای سیستم بینایی ارائه شده‌اند. سیستم بینایی انسان اشیا را در معماری سلسله مراتبی بازشناسی می‌کنند. این سیستم، ویژگی‌های ابتدایی و ساده یک شیء را در نواحی اولیه قشر بینایی مغز استخراج می‌کند. با پیشروی در مسیر بازشناسی یک شیء در قشر بینایی مغز به تدریج ویژگی‌ها پیچیده‌تر و در نهایت منجر به بازشناسی شیء می‌شود. در همین راستا مدل‌های محاسباتی ارائه‌شده با تبعیت از این رفتار سلسله مراتبی، دارای معماری چند لایه می‌باشند. این مدل‌ها معمولا در نحوه استخراج ویژگی، قانون‌های یادگیری و یا عملکرد طبقه‌بند دستخوش تغییر می‌شوند و بهبود و توسعه می‌یابند. در این پایان‌نامه با بررسی عملکرد مدل محاسباتی مبتنی بر قشر بینایی مغز نئوکوگنیترون، برای توسعه آن در راستای بهبود عملکرد بر روی مساله بازشناسی نوشتار فارسی تلاش کردیم. تغییر طبقه‌بند، تغییر در نحوه پاسخ‌دهی سلول‌ها و ایجاد مکانیسم اصلاح لایه استخراج ویژگی‌های سطح بالا بر اساس فعالیت آن، مجموعه کارهای انجام‌شده در این پایان‌نامه هستند. نتایج نشان می‌دهد که مدل‌های پیشنهادی با اندازه کوچکتر شبکه کارایی بهتری (بیش از %‎97) نسبت به مدل‌های مشابه دارند.کلمات کلیدی: قشر بینایی مغز، دستگاه بینایی، مدل سلسله مراتبی، نئوکوگنیترون، بازشناسی الگو، بازشناسی نوشتار.
    Abstract
    What is going on in our brain while seeing an object? How does our visual system works? Recognizing a familiar face in a crowded place, viewing a billboard in a snowy day from a long distance, reading a text written with a bad handwriting, etc. are only a tiny part of our incredible precise and agile visual system s capabilities. A lot of studies have tried to model this system using biological findings from brain s visual cortex. Therefore, many computational models have been proposed to mimic the behavior of visual system. Human visual system recognizes objects in hierarchical architecture. In the first step, this system extracts simple features of an object in the brain s primitive visual areas. In the later steps of the visual pathway, the system extracts more complex features and finally results a complete object recognition. The proposed computational models inspired by this hierarchical procedure, have multilayer architecture. These models are usually developed, changed and optimized based on feature extraction methods, learning rules, or classifier functionality. In this thesis, we tried to optimize the performance of the Neocognitron model, a computational model developed based on the visual cortex, on the Persian handwritten digits recognition problem. Utilizing a new classifier, changing the cells responses, and creating a new mechanism for the high level feature extraction layer with respect to its activities, are the main attempts in this thesis. The results indicate that, our suggested models could achieve higher recognition rate(greater than 97%) with smaller size of networks comparing to the other similar models.Keywords: Visual cortex, Visual system, Hierarchical system, Neocognitron, Pattern recognition, OCR.