عنوان پایاننامه
طراحی و پیاده سازی یک سامانه پرسش و پاسخ پزشکی
- رشته تحصیلی
- مهندسی فناوری اطلاعات پزشکی
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71541
- تاریخ دفاع
- ۲۹ شهریور ۱۳۹۴
- دانشجو
- حامد فکورشندی
- استاد راهنما
- هادی ویسی
- چکیده
- از دیرباز انسانها به دنبال یافتن راهی برای تعامل راحتتر با ماشینها و به خدمت گرفتن آنها برای سادهتر نمودن انجام امورشان بودند که سامانههای پرسش و پاسخ بهعنوان یکی از مولفههای تحقق چنین هدفی در نظر گرفته شدهاند. سامانههای پرسش و پاسخ یکی از کاربردهای پردازش متون میباشند که در آنها یک پرسش به زبان طبیعی از کاربر دریافت میشود. در این سامانه پس از انجام فرایند پیشپردازش بر روی پرسش، کلمات کلیدی با استفاده از واحد پردازش پرسش استخراج میشوند. در مرحله بعدی، واحد بازیابی اسناد با استفاده از این کلمات کلیدی و از طریق دادگان موجود، سند مناسب با پرسش را بازیابی میکند. در نهایت آن بخش از سند که بیشترین ارتباط را با پرسش دارد، از متن استخراج شده و به کاربر نمایش داده میشود. در این پایاننامه یک سامانه پرسش و پاسخ فارسی با کاربرد پزشکی طراحی و پیادهسازی شده است. در حوزه سلامت و پزشکی، این سامانه با هدف سهولت دسترسی پزشکان، فراهمکنندگان سلامت و کاربران عادی به منابع اطلاعاتی مهم، ایجاد شده است. در زمینه سامانههای پرسش و پاسخ در زبان فارسی به دلیل پژوهشهای اندک صورت گرفته، تا بهحال هیچ دادگانی بهصورت استاندارد وجود نداشته است. برای رفع این مشکل، یکی از فعالیتهای عمده ما، تمرکز بر روی جمعآوری اسناد پزشکی در مورد داروها و بیماریهای مختلف بود. از آنجاییکه پردازش بر روی اسناد دارای ساختار در سامانههای پرسش و پاسخ باعث افزایش کارایی میشود، بنابراین تمامی اسناد به حالتی نیمه ساختاریافته تبدیل شدند. ساختار این اسناد بهگونهای است که برای سایر سامانههای پرسش و پاسخ که نیازمند اطلاعات پزشکی میباشند نیز قابلاستفاده است. سامانه موردپژوهش در این پایاننامه، دارای سه واحد اصلی پردازش پرسش، بازیابی اسناد و استخراج پاسخ است. واحد پردازش پرسش مهمترین عامل در پاسخگویی به پرسش کاربر است. این واحد از 4 مولفه تشکیل شده است که بهصورت سلسلهمراتبی و با رویکردهای مختلف درصدد استخراج مناسبترین کلمات و عبارات کلیدی میباشند. برای کمک به این مولفهها دو واژهنامه نیز وجود دارند که شامل اسامی داروها/بیماریها و کلمات/عبارات کلیدی میباشند. عملکرد مولفههای واحد پردازش پرسش در دادگان آزمایشی که شامل پرسشهای کاربران عادی و پزشکان است، نشان میدهد که این سامانه در %83.6
- Abstract
- Human beings are always looking for methods to have better interaction with machines. According to the Turing test, an intelligent machine must have the ability to communicate with human beings easily. Question answering (QA) systems are intended as one of the components to achieve this goal. In these systems, a natural question is received from a user, afterward, question processing unit try to extract keywords and query it using different techniques. The Documents Retrieval unit retrieves the appropriate document using the keywords and the database. Finally, a section of the retrieved document that is most relevant to the question is extracted and represented to the user. In this thesis, a Persian question answering system is designed and implemented for medical applications. The system has been created to ease the access to information resources for doctors, health providers and users. Unfortunately, there is no standard data for the Persian medical question answering systems. Therefore, a set of documents related to drugs and diseases are collected. The processing of the structured documents improves the performance of the QA system that's why all documents were converted into semi-structured documents. The developed system consists of three main units: question processing, document retrieval and answer extraction. The question processing unit, as the most important module, consists of four components that sequentially extract keywords/queries. These components use a dictionary of drugs/diseases names and keywords/queries. The result showed that our system answers over 83% of the questions correctly.