عنوان پایاننامه
کاربرد روشهای ترکیب اطلاعات در کشف دانش از نسخ دارویی
- رشته تحصیلی
- مهندسی فناوری اطلاعات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 39584;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 1509
- تاریخ دفاع
- ۲۸ مهر ۱۳۸۷
- دانشجو
- مرضیه سادات حسینی نسب نیاکی
- استاد راهنما
- مسعود رهگذر
- چکیده
- چکیده کشف دانش از پایگاه های داده در حوزه فرآیند ارائه خدمات بهداشتی، درمانی و دارویی با توجه به حجم انبوه داده ها و لزوم کسب دانش بیشتر به منظور فراهم آمدن زمینه مناسب برای انواع تصمیم گیری های درمانی و مدیریتی از اهمیت ویژه ای برخوردار است. یکی از مهم ترین ابزار کشف دانش به کارگیری روش های ترکیب اطلاعات در این حوزه می باشد. بر این اساس در این پایان نامه تلاش بر آن است تا به بیان کاربردهای روش های ترکیب اطلاعات در کشف دانش از نسخ پرداخته شود. تمرکز اصلی این تحقیق نیز بر روی ارائه روش های عملی کشف تقلب از نسخ دارویی با استفاده از روش های ترکیب اطلاعات به عنوان یکی از مهم ترین این کاربردها خواهد بود. زیرا، امروزه با توجه به رشد روزافزون جمعیت و افزایش تعداد بیمه شوندگان در سطح جامعه، حجم زیادی از اطلاعات مربوط به ارائه خدمات درمانی به آن ها در قالب نسخ دارویی وجود دارد که بانک های اطلاعاتی شرکت ها و سازمان های بیمه گذار را مملو از داده های گوناگون نموده است. در این میان، ردیابی تقلب برخی از افراد سودجو که ممکن است اقدام به انجام تخلف های گوناگون در زمینه دریافت دارو از طریق نسخ دارویی نمایند, نه تنها بسیاری از هزینه های شرکت های بیمه گذار را کاهش و درآمدهای آن ها را افزایش می دهد، بلکه از کمبود برخی از داروهای کم یاب و گران قیمت و در عین حال ضروری و حیاتی برای درمان برخی از بیماری های مهلک و ایجاد بازار سیاه برای آن ها جلوگیری به عمل می آورد. در این تحقیق براساس دو سناریوی کشف تقلب، ابتدا با اعمال الگوریتم Apriori به عنوان یکی از روش های داده کاوی به منظور کشف مجموعه های پرتکرار، موقعیت های رخداد تقلب و احتمال بروز آن ها از جهات مختلف در مجموعه نسخ دارویی, بررسی و به این صورت، دو دسته منبع اطلاعاتی برای تصمیم گیری در مورد رخداد تقلب ایجاد می شود. سپس، با به کارگیری روش های ترکیب اطلاعات به نام هایDempster-Shafer به عنوان یکی از بهترین روش های ترکیب اطلاعات با پوشش عدم اطمینان و نایقینی و نیز روش OWA، احتمال رخداد تقلب در نسخه های مربوط به یک فرد برای هریک از زیرمجموعه داروهای مندرج در نسخ وی تعیین می گردد. به این ترتیب، زیرمجموعه های دارویی مشکوک به تقلب با احتمال رخداد تقلب در آن ها و نیز افراد مورد سوءظن در این زمینه شناسایی می شوند. در ادامه تحقیق، با استفاده از یک مجموعه آزمون منتخب، صحت نتایج مربوط به روش های پیشنهادی سنجیده و روش پیشنهادی بر مبنای Dempster-Shafer به عنوان روش منتخب برای کشف تقلب در نسخ دارویی برگزیده شد.
- Abstract
- Abstract Knowledge Detection from Databases (KDD) in healthcare process is very significant with consideration to great volume of data and necessity of producing knowledge for decision making in several medical and administration fields. One of the most important tools for knowledge detection is information fusion. Thus, the information fusion usage in knowledge discovery from drug prescriptions is described in this thesis. Main focus of this research is on proposing practical methods for fraud detection of drug prescriptions by applying information fusion techniques as one of the most popular approaches in this field. Today, considering the increasing rate of population and number of healthcare insurance customers, the huge amount of information related to the healthcare insurance services in the format of drug prescriptions are available in insurance companies' databases. In this context, tracing frauds of some fraudulent people in receiving non-authorized drugs is an important problem. Due to this fact, it can decrease many of insurance companies' costs and increase their revenues from one side and prevent the lack of expensive and rare drugs that are vital for treatment of some lethal diseases from the other side. In this research work, firstly, based on two fraud detection scenarios, fraud situations in the person's drug prescription set and their primary probabilities are defined by applying Apriori algorithm as a data mining technique for finding most frequent item sets. As a result, two information sources for deciding about fraud occurrences are created. Secondly, two information fusion methods, Dempster-Shafer method as one of the best data fusion methods in uncertainty situations and OWA method, are used and compared with each other to decide about final fraud occurrence probabilities for each drug subset in the person's prescription set. Consequently, suspicious drug subsets as frauds and fraudulent persons are defined. In the rest of research work, evaluation of the experimental results using a selected test data set showed that the proposed method based on Dempster-Shafer technique has got more accurate and precise results rather than the OWA method for fraud detection in drug prescriptions.