عنوان پایاننامه
ارئه یک سیستم توزیع شده مقیاس پذیر کارا برای کشف تقلب
- رشته تحصیلی
- مهندسی فناوری اطلاعات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2238;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 58189
- تاریخ دفاع
- ۰۳ بهمن ۱۳۹۱
- دانشجو
- آزاده نمیرانیان
- استاد راهنما
- محمود رضا هاشمی
- چکیده
- طی سالهای اخیر به دلیل رشد سریع تعداد استفاده کنندگان از ابزارهای خرید و پرداخت بر خط و حجم تراکنشهای مالی، تعداد و پیچیدگی تقلب ها نیز روندی رو به رشد را نشان میدهد. یکی از مؤلفههای کلیدی برای هر سامانه پرداخت الکترونیکی زیرساختی مناسب، کارا و ایمن برای تشخیص تقلب میباشد.افزایش تعداد راه های ممکن برای انجام تراکنشهای بانکی و از طرفی افزایش تعداد افراد استفاده کننده از این روشها، موجب افزایش سریع حجم کلی تراکنشهای بانکی شده که سیستمهای کشف تقلب را با مشکل مقیاس پذیری مواجه ساخته است. هنگامی یک سیستم مقیاس پذیر است که با افزایش اندازه سیستم، همواره میزان منابع کافی برای انجام عملیات خود در دسترس داشته باشد. در این پایان نامه با تغییر روش ارتباطی بین گره های بانکی و نحوه ارتباط آنها با هم مقیاس پذیری سیستم کشف تقلب توزیع شده را بهبود میدهیم. صحت کشف تقلب در این سیستمها از اهمیت بالایی برخوردار است، از این رو انتظار میرود همراه با افزایش مقیاس سیستم، میزان صحت آن کاهش نیابد. در واقع در این تحقیق میخواهیم تا با تغییر معماری سیستم به مقیاس پذیری مورد نظر برسیم. در این تحقیق ابتدا با تمرکز بر چالش مقیاس پذیری، یک معماری سلسله مراتبی ارائه دادهایم. این معماری در محیطهای توزیع شده ای که تراکم گرهها زیاد میباشد، کارایی بالایی داشته و مقیاس پذیری سیستم را افزایش میدهد. در ادامه یک معماری همتا به همتا ارائه داده ایم. ارزیابی نتایج این معماریها نشان میدهد که در مواردی که ارتفاع ساختار سلسله مراتبی بسیار افزایش یابد و یا شبکه ای تنک داشته باشیم، این روش میتواند سرعت تشخیص تقلب را بهبود بخشد. در انتها یک معماری ترکیبی از دو معماری پیشین ارائه شده است که می تواند علاوه بر حل مشکل مقیاس پذیری، از نقاط ضعف دو معماری پیشین رهایی یابد. این معماری در محیطهایی که هیچ نظم خاصی در تعداد و توزیع گرهها در سرتاسر شبکه وجود ندارد، دارای کارایی و مقیاس پذیری بیشتری میباشد. به منظور ارزیابی معماریهای ارائه شده از منابع دادهای ساختگی در زمینه کشف تقلب استفاده شده است. علاوه بر آن به دلیل شباهت زیاد روشهای کشف تقلب به روشهای تشخیص نفوذ، معماریهای پیشنهادی بر روی منبع داده KDD99 نیز اعتبارسنجی شدهاند ارزیابی های صورت گرفته نشان می دهند که معماریهای ارائه شده مقیاس پذیری سیستم کشف تقلب را در محیط توزیع شده بهبود میبخشند. علاوه بر آن میزان صحت کشف تقلب که در واقع کیفیت سرویس سیستم کشف تقلب را نشان میدهد، در معماریهای پیشنهادی بدون تغییر باقی میماند. هزینه ارتباطات از دیگر مؤلفههایی است که بررسی شده و ارزیابیها کاهش هزینه چشمگیری را نشان دادهاند.
- Abstract
- In recent years, considering the cost reduction, improved performance and ease of use that e-commerce has provided more and more businesses rely on this channel for their day to day operation. But the increasing volume of e-shoppers makes it an inviting source of revenue for criminals. Despite all the progress in developing secure methods, security is still a main concern for e-commerce users. This emphasizes the necessity for an efficient, yet accurate online fraud detection system. The architecture of most current online transaction systems such as electronic banking is distributed in nature. Considering the extremely large number of transactions that is carried out by such distrusted systems, one of the most important and vital characteristics of an efficient fraud detection framework in such an environment, is scalability. The objective of this thesis is to improve the efficiency of fraud detection methods by proposing a scalable distributed fraud detection architecture. As a first improvement, a hierarchical architecture to build global and local models in distributed fraud detection has been proposed. The proposed structure increases scalability and reduces the cost of making models. The second proposed architecture is a peer to peer structure where all nodes have the gobal model. This leads to a reduction in fraud detection time. Similar to the previous hierarchical architecture, it is scalable and reduces cost of making models and fraud detection cost. Finally, a hybrid architecture was proposed to solve the scalability problem. It shares the advantages of both previous architectures. We have used synthetic financial data sets to evaluate the accuracy and scalability of the proposed architectures in fraud detection. Moreover, since there is a remarkable similarity between fraud detection methods and intrusion detection systems, the proposed architectures have been evaluated in terms of accuracy and scalability using a benchmark for network intrusion detection (KDD99). Results indicate that the proposed structures have an order of O(1) for the required amount of processing, storage and bandwidth resources in each node, compared to conventional client-server architectures that demonstrate a linear relationship for the central server for the same resources.