عنوان پایاننامه
توسعه مدل محاسباتی Neocognitron جهت بازشناسی دست نوشته فارسی
- رشته تحصیلی
- علوم کامپیوتر
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس علوم شماره ثبت: 5557;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 66625
- تاریخ دفاع
- ۰۸ بهمن ۱۳۹۳
- دانشجو
- علیرضا احمدی
- استاد راهنما
- محمد گنج تابش
- چکیده
- وقتی شیءای را میبینیم، چه در مغز ما میگذرد؟ نحوه عملکرد سیستم بینایی ما چگونه است؟ شناسایی چهره یک فرد آشنا در محیطی شلوغ، خواندن تابلوی یک مغازه در یک روز برفی و از فاصلهای دور، خواندن متنی که فردی با دستخط بد نوشته است و ... تنها بخش کوچکی از تواناییهای خارقالعادهی دستگاه بینایی انسان است که با سرعت و دقت بالایی توسط آن انجام میشود. بسیاری با ایدهگیری از یافتههای بیولوژیکی قشر بینایی مغز، سعی در مدلسازی این سیستم دارند. از همین رو مدلهای محاسباتی بسیاری با تقلید از رفتارهای سیستم بینایی ارائه شدهاند. سیستم بینایی انسان اشیا را در معماری سلسله مراتبی بازشناسی میکنند. این سیستم، ویژگیهای ابتدایی و ساده یک شیء را در نواحی اولیه قشر بینایی مغز استخراج میکند. با پیشروی در مسیر بازشناسی یک شیء در قشر بینایی مغز به تدریج ویژگیها پیچیدهتر و در نهایت منجر به بازشناسی شیء میشود. در همین راستا مدلهای محاسباتی ارائهشده با تبعیت از این رفتار سلسله مراتبی، دارای معماری چند لایه میباشند. این مدلها معمولا در نحوه استخراج ویژگی، قانونهای یادگیری و یا عملکرد طبقهبند دستخوش تغییر میشوند و بهبود و توسعه مییابند. در این پایاننامه با بررسی عملکرد مدل محاسباتی مبتنی بر قشر بینایی مغز نئوکوگنیترون، برای توسعه آن در راستای بهبود عملکرد بر روی مساله بازشناسی نوشتار فارسی تلاش کردیم. تغییر طبقهبند، تغییر در نحوه پاسخدهی سلولها و ایجاد مکانیسم اصلاح لایه استخراج ویژگیهای سطح بالا بر اساس فعالیت آن، مجموعه کارهای انجامشده در این پایاننامه هستند. نتایج نشان میدهد که مدلهای پیشنهادی با اندازه کوچکتر شبکه کارایی بهتری (بیش از %97) نسبت به مدلهای مشابه دارند.کلمات کلیدی: قشر بینایی مغز، دستگاه بینایی، مدل سلسله مراتبی، نئوکوگنیترون، بازشناسی الگو، بازشناسی نوشتار.
- Abstract
- What is going on in our brain while seeing an object? How does our visual system works? Recognizing a familiar face in a crowded place, viewing a billboard in a snowy day from a long distance, reading a text written with a bad handwriting, etc. are only a tiny part of our incredible precise and agile visual system s capabilities. A lot of studies have tried to model this system using biological findings from brain s visual cortex. Therefore, many computational models have been proposed to mimic the behavior of visual system. Human visual system recognizes objects in hierarchical architecture. In the first step, this system extracts simple features of an object in the brain s primitive visual areas. In the later steps of the visual pathway, the system extracts more complex features and finally results a complete object recognition. The proposed computational models inspired by this hierarchical procedure, have multilayer architecture. These models are usually developed, changed and optimized based on feature extraction methods, learning rules, or classifier functionality. In this thesis, we tried to optimize the performance of the Neocognitron model, a computational model developed based on the visual cortex, on the Persian handwritten digits recognition problem. Utilizing a new classifier, changing the cells responses, and creating a new mechanism for the high level feature extraction layer with respect to its activities, are the main attempts in this thesis. The results indicate that, our suggested models could achieve higher recognition rate(greater than 97%) with smaller size of networks comparing to the other similar models.Keywords: Visual cortex, Visual system, Hierarchical system, Neocognitron, Pattern recognition, OCR.