عنوان پایان‌نامه

طراحی و پیاده سازی یک سامانه پرسش و پاسخ پزشکی



    دانشجو در تاریخ ۲۹ شهریور ۱۳۹۴ ، به راهنمایی ، پایان نامه با عنوان "طراحی و پیاده سازی یک سامانه پرسش و پاسخ پزشکی" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71541
    تاریخ دفاع
    ۲۹ شهریور ۱۳۹۴
    استاد راهنما
    هادی ویسی

    از دیرباز انسان‌ها به دنبال یافتن راهی برای تعامل راحت‌تر با ماشین‌ها و به خدمت گرفتن آن‌ها برای ساده‌تر نمودن انجام امورشان بودند که سامانه‌های پرسش و پاسخ به‌عنوان یکی از مولفه‏های تحقق چنین هدفی در نظر گرفته شده‌اند. سامانه‌های پرسش و پاسخ یکی از کاربردهای پردازش متون می‌باشند که در آنها یک پرسش به زبان طبیعی از کاربر دریافت می‌شود. در این سامانه پس از انجام فرایند پیش‌پردازش بر روی پرسش، کلمات کلیدی با استفاده از واحد پردازش پرسش استخراج می‌شوند. در مرحله بعدی، واحد بازیابی اسناد با استفاده از این کلمات کلیدی و از طریق دادگان موجود، سند مناسب با پرسش را بازیابی می‌کند. در نهایت آن بخش از سند که بیشترین ارتباط را با پرسش دارد، از متن استخراج شده و به کاربر نمایش داده می‌شود. در این پایان‌نامه یک سامانه پرسش و پاسخ فارسی با کاربرد پزشکی طراحی و پیاده‌سازی شده است. در حوزه سلامت و پزشکی، این سامانه با هدف سهولت دسترسی پزشکان، فراهم‏کنندگان سلامت و کاربران عادی به منابع اطلاعاتی مهم، ایجاد شده است. در زمینه سامانه‌های پرسش و پاسخ در زبان فارسی به دلیل پژوهش‌های اندک صورت گرفته، تا به‌حال هیچ دادگانی به‌صورت استاندارد وجود نداشته است. برای رفع این مشکل، یکی از فعالیت‌های عمده ما، تمرکز بر روی جمع‌آوری اسناد پزشکی در مورد داروها و بیماری‌های مختلف بود. از آنجایی‌که پردازش بر روی اسناد دارای ساختار در سامانه‌های پرسش و پاسخ باعث افزایش کارایی می‌شود، بنابراین تمامی اسناد به حالتی نیمه ساختاریافته تبدیل شدند. ساختار این اسناد به‌گونه‌ای است که برای سایر سامانه‌های پرسش و پاسخ که نیازمند اطلاعات پزشکی می‌باشند نیز قابل‌استفاده است. سامانه موردپژوهش در این پایان‌نامه، دارای سه واحد اصلی پردازش پرسش، بازیابی اسناد و استخراج پاسخ است. واحد پردازش پرسش مهم‌ترین عامل در پاسخ‌گویی به پرسش کاربر است. این واحد از 4 مولفه تشکیل شده است که به‌صورت سلسله‌مراتبی و با رویکردهای مختلف درصدد استخراج مناسب‌ترین کلمات و عبارات کلیدی می‌باشند. برای کمک به این مولفه‌ها دو واژه‌نامه نیز وجود دارند که شامل اسامی داروها/بیماری‌ها و کلمات/عبارات کلیدی می‌باشند. عملکرد مولفه‌های واحد پردازش پرسش در دادگان آزمایشی که شامل پرسش‌های کاربران عادی و پزشکان است، نشان می‌دهد که این سامانه در %83.6
    Abstract
    Human beings are always looking for methods to have better interaction with machines. According to the Turing test, an intelligent machine must have the ability to communicate with human beings easily. Question answering (QA) systems are intended as one of the components to achieve this goal. In these systems, a natural question is received from a user, afterward, question processing unit try to extract keywords and query it using different techniques. The Documents Retrieval unit retrieves the appropriate document using the keywords and the database. Finally, a section of the retrieved document that is most relevant to the question is extracted and represented to the user. In this thesis, a Persian question answering system is designed and implemented for medical applications. The system has been created to ease the access to information resources for doctors, health providers and users. Unfortunately, there is no standard data for the Persian medical question answering systems. Therefore, a set of documents related to drugs and diseases are collected. The processing of the structured documents improves the performance of the QA system that's why all documents were converted into semi-structured documents. The developed system consists of three main units: question processing, document retrieval and answer extraction. The question processing unit, as the most important module, consists of four components that sequentially extract keywords/queries. These components use a dictionary of drugs/diseases names and keywords/queries. The result showed that our system answers over 83% of the questions correctly.