عنوان پایاننامه
ایجاد یک مدل هیبریدی فازی- میان تراکنشی برای کشف الگوهای انجمنی روی داده های مالی
- رشته تحصیلی
- علوم تصمیم و مهندسی دانش
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه دانشکده علوم و فنون نوین شماره ثبت: 299022;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 76046;کتابخانه دانشکده علوم و فنون نوین شماره ثبت: 299022;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 76046
- تاریخ دفاع
- ۱۲ بهمن ۱۳۹۴
- دانشجو
- مصطفی رحمانی
- استاد راهنما
- سامان هراتی زاده
- چکیده
- کاوش دادگان مالی با استفاده از الگوریتمهای کاوش الگوی توالی، به طور معمول با دو نوع نقصان روبرو هستند. اولین نقیصه مربوط به بینام بودن نوع اطلاعات استخراجی است. بینام بودن اطلاعات به معنای ارائه الگوهای مشترک در بین تمامی کاربران (شرکتها) است. این نقیصه باعث میشود که به طور خاص درباره یک کاربر نتوان الگویی مشخص را پیشبینی کرد. بلکه تمام پیشبینیها بر مبنای روندهای کلی مشاهده شده در تمام کاربران است. نقیصه دوم این الگوریتمها به جنس دادگان ورودی مسئله مربوط میشود. در اغلب اطلاعات مالی اطلاعات ورودی از جنس اعداد حقیقی است. با این حال الگوریتمهای کاوش الگوی توالی توانایی پردازش این نوع دادگان به طور مستقیم را ندارند. به منظور رفع این مشکل اغلب محققان از دو نوع تبدیل به منظور تعریف قلم استفاده کردهاند. دستهای با گسستهسازی دادگان و افراز دامنه ورودی به این مجموعه گسسته اقدام به ساخت اقلام کردهاند. دستهای دیگر با معرفی یک حد آستانه با هر قلم به صورت وجود یا عدم وجود برخورد کردهاند. هر دوی این روشها حساسیت کمی به تمامی دادگان ورودی دارند و اطلاعاتی را در تصمیمگیری دخیل نمیکنند. جهت رفع مشکلات ارائه شده، روش ترکیبی کاوش الگو فازی-میانتراکنشی ارائه شده است. در این روشبه منظور رفع مشکل بینام بودن الگوهای استخراجی از روش کاوش میانتراکنشی و به منظور رفع مشکل حذف اطلاعات با گسستهسازی، با استفاده از مجموعهای از روشها، اقلام به صورت فازی استفادهشدهاند. همچنین با برخی بهبودها در اجرای الگوریتم مصرف حافظه بهبود یافت و زمان اجرای الگوریتم کاهش پیدا کرد. با استفاده از این الگوریتم و در مقایسه با الگوریتم مبنا میتوان دقت پیشبینی با استفاده از این قوانین را از 44/0 به 52/0رسانید. همچنین مجموع میانگین مربعات خطا حدود 3/14% کاهش یافت.
- Abstract
- Weaknesses of traditional methods in mining of financial datasets are based on two main categories. First, they cannot collect any information about each customer(company). They only report some general common behavior among all customers and there is no further information about each customer. Second, when the data is in type of real numbers such as financial data it cannot do mining procedure without loss of data. Traditionally when researchers faced these kinds of data they have tried to discretize the data in some major classes like positive and negative. Some others defined a threshold to accept or reject generating an item for a specific value of data. These both methods will cause the loss of data. To fix this lack of attention on data, we have introduced an algorithm. This algorithm attends carefully to data by using fuzzy items instead of discrete ones. And it also cares about each customers pattern using Inter Sequence Pattern Mining algorithms. We also optimized the algorithm to use less memory and process the patterns faster. By applying our method to retrieve fuzzy inter-sequence patterns, we managed to improve accuracy of our predictions from 0.44 to 0.52. Also the Mean Square Error of our prediction has been improved around 14.3%.