غنی سازی معنایی خطوط سیر مکانی -زمانی
- رشته تحصیلی
- مهندسی عمران-سیستمهای اطلاعات جغرافیایی(GIS)
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: 3426;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 77879;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: 3426;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 77879
- تاریخ دفاع
- ۰۹ شهریور ۱۳۹۵
- دانشجو
- سمیه عاقل شاه نشین
- استاد راهنما
- رحیم علی عباسپور
- چکیده
- تحقیقات مرتبط با دادههای خط سیر اغلب با تمرکز بر فنون ذخیرهسازی/بازیابی، مدلسازی، دادهکاوی و کشف دانش از دادههای خط سیر بوده است. این مطالعات عمدتاً بر جنبههای هندسی دادههای خام تأکید داشتهاند. با این حال، امروزه شاهد گسترش تقاضا در بخشهای کاربردی مختلف، با فهم رفتار (الگوی) معنایی اشیاء در حال حرکت هستیم. غنی سازی معنایی خطوط سیر مکانی، با هدف افزودن معنا به داده های خام حرکت است که فهم بهتری از مسیر شئ متحرک را امکانپذیر می کند. غنی سازی بر اساس منابع اطلاعاتی مختلف انجام میشود. این اطلاعات شامل اطلاعات جغرافیایی موجود در مسیر حرکت، اطلاعات مربوط به کاربرد و یا اطلاعات استنتاج شده از داده های خام حرکت است. در این تحقیق چارچوبی ارائه شده است که داده های خام حرکت را در یک فرآیند محاسباتی پردازش می کند و خطوط سیر غنی سازی شده با معنا تولید می شود. چارچوب ارائه شده شامل چهار گام محاسباتی است. گام نخست که برای پاکسازی داده-های حرکت ارائه شده، شامل الگوریتمی برای حذف داده های پرت و الگوریتمی برای فشرده سازی داده های حرکت است. در گام دوم، روشی برای استخراج خطوط سیر مکانی-زمانی بر اساس ویژگی های داده و کاربرد موردنظر ارائه شده است. در گام سوم با هدف آماده سازی داده ها برای استخراج اطلاعات معنایی، یک الگوریتم خوشه بندی سرعت-مبنا بر اساس مدل توقف-حرکت ارائه شده است که خطوط سیر ساختاریافته را به صورت اپیزودهای معنادار از داده های خط سیر استخراج میکند. در گام آخر نیز با معرفی مفاهیمی چون غنی سازی بر اساس توقف های فعال و غیرفعال، روشی برای غنی سازی معنایی ارائه شده است که محتملترین مکان را در هر اپیزود، استنتاج می کند. ارزیابی نتایج به دست آمده در هر مرحله از غنیسازی نشان داد الگوریتم سرعت مبنای ارائه شده در پاکسازی داده های حرکت قادر است دادههای پرت را از خطوط سیر ناهمگن شناسایی و حذف کند. در الگوریتم ارائه شده برای فشردهسازی نیز همزمان با حذف دادههای اضافی، ماهیت معنایی خط سیر حفظ می شود. روش ارائه شده برای خوشه بندی نقاط خط سیر برای شناسایی بخش های معنادار نیز با استفاده از اطلاعات شئ متحرک و مسیر حرکت به صورت پویا قادر به شناسایی بخش های همگن در هر خط سیر است. در نهایت الگوریتم ارائه شده برای اضافه کردن معنا به خط سیر نیز قادر است با دقت 84 درصد اپیزودهای شناسایی شده در خطوط سیر را با اطلاعات معنایی موجود در مسیر حرکت غنی سازی کند. کلمات کلیدی: خط سیر، غنی سازی معنایی، مدل توقف-حرکت، سرعت ، فشرده سازی
- Abstract
- Research related to trajectory data management have been mostly focusing on the techniques of storage/retrieval, modeling, data mining, and knowledge discovery from trajectory data. These studies are mainly emphasized the raw data from geometric aspects. However, developments of different applications to detect semantic behaviors (patterns) of moving objects are growing. Semantic enrichment of spatial trajectories, with the aim of adding meaning to raw movement data, provides a better understanding of the path of moving object. Semantic enrichment is based on various information sources. This information includes geospatial information in the path of the moving object, application-based information, and information derived from raw movement data. In this study, a computational framework is proposed that the raw data are processed and trajectories enriching with semantic information is produced. .The proposed computational framework consists of four steps: The first step is presented to clean up the data, to providing an algorithm to remove outliers from heterogeneous trajectories and data compression algorithm for remove extra point of trajectories. In the second step, a method is provided for extracting spatio-temporal trajectories that is based on the characteristics of trajectory and intended application. In the third phase, in order to extraction semantic information, a speed-based clustering algorithm is provided that is based on the concept of stop and move conceptual model, that is enable to extract structured trajectories in the form of episodes. Finally, in the last step of enrichment, with the introduction of active and non-active stops, a method is provided, that deducing the most likely place in episodes of structured trajectory. Evaluation results in any stage of enrichment indicated that proposed speed-based algorithm for data cleaning is able to removing outliers of heterogeneous trajectories. In proposed algorithm for compression, at the same time eliminating redundant data, the semantic nature of trajectory is preserved. The presented clustering algorithm to identifying episodes, with using moving object information and Information related to the path of the moving object is able to identifying homogeneous sections in each trajectory. Finally, the proposed algorithm to adding meaning to the trajectories is able to enriching trajectories with semantic information with an accuracy of 84 percent. Keywords: Trajectory, Semantic Enritchment, Stop-Move Model, Velocity, Compression