عنوان پایاننامه
تشخیص گفتار برای گزارش دهی دهی حرفه ای و ثبت داد ها
- رشته تحصیلی
- مهندسی صنایع
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: 2860;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 66688
- تاریخ دفاع
- ۲۹ دی ۱۳۹۳
- دانشجو
- حسین جمشیدی فارسانی
- استاد راهنما
- عباس کرامتی
- چکیده
- کاربرد های وسیع در چندین زمینه، مانند مراقبت های پزشکی، نظامی، سامانه های خودرو و بازی های ویدئویی، محققان بسیاری را به موضوع تشخیص گفتار خودکار کشانده است. تشخیص گفتار ویندوز به عنوان یک نرم افزار رایگان تعبیه شده در ویندوز ویستا، هفت و هشت، مخاطبان بیشتری از دیگر نرم افزارهای تشخیص گفتار دارد، اما متاسفانه برای اینکه بتوانیم به طور موثر از این نرم افزار به منظور گزارش نویسی حرفه ای و کمک به افراد معلول استفاده کنیم، چندین کمبود در این نرم افزار وجود دارد. هدف این پروژه توسعه ی سیستمی است که جای خالی این کمبودها، همانند قابلیت خلق کردن انواع مختلف فرمان های صوتی و ایجاد فرهنگ های گفتار سفارشی و وارد کردن این فرهنگ های گفتار، را پر کند. اگرچه برای افزایش کارایی این سیستم، چندین توسعه ی دیگر نیز مورد نیاز بود. پس از توسعه ی این سیستم تشخیص گفتار به کمک زبان برنامه نویسی سی شارپ و خلق فرهنگ های گفتار پاتولوژی به عنوان مطالعه موردی، با کمک گرفتن از 10 متخصص پزشکی به عنوان کاربران نهایی، سه آزمایش را برای آزمودن کارایی این سیستم و همچنین دقت فرهنگ های گفتار پاتولوژی ساخته شده و نیز یافتن ضریب بهینه برای ترکیب فرهنگ های ساخته شده با فرهنگ های گفتار پایه ی موجود، طراحی و اجرا نمودیم. کلمات کلیدی: تشخیص گفتار خودکار، مدل زبانی آماری، گزارش دهی حرفه ای، تشخیص گفتار ویندوز
- Abstract
- Widespread applications in various fields, such as health care, military, car systems and video games, have brought many researchers to the subject of Automatic Speech Recognition (ASR). Windows Speech Recognition (WSR) as a free built-in application in Windows Vista, Seven and 8 has more audiences than any other speech recognition application, but unfortunately it lacks several facilities to be used effectively in the fields like professional reporting and assisting the persons with disabilities. The aim of this thesis is to develop a system that makes up for these shortcomings such as the facility for creating various types of Macros and building custom Speech Dictionaries and also importing these Speech Dictionaries. Although for increasing the efficiency of this system, several other developments were needed. After developing the speech recognition system with the help of C# programming Language and creating Pathology speech dictionaries as the case study, we designed three experiments in order to test the functionality of the system and the accuracy of the imported pathology speech dictionaries which were created throughout this research and also finding the optimized ratio for mixing custom speech dictionaries with base speech dictionaries, by involving 10 medical professionals as the end users. Keywords: Automatic Speech Recognition, Statistical Language Model, Professional Reporting, Windows Speech Recognition (WSR)