عنوان پایاننامه
سیستمهای پیشنهاد دهنده برای محیطهای چند ناشری
- رشته تحصیلی
- مهندسی کامپیوتر -نرم افزار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2714;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 68982
- تاریخ دفاع
- ۲۲ تیر ۱۳۹۴
- دانشجو
- حامد زمانی
- استاد راهنما
- آزاده شاکری
- چکیده
- گسترش سریع اینترنت یافتن اطلاعات مرتبط با نیازهای کاربران را با سختی روبهرو کرده است. برای حل این مشکل، سیستمهای پیشنهاددهنده ارائه شدهاند که کاربران را از وجود اقلام جدید باخبر میکنند. با توجه به افزایش تعداد ارائهکنندههای داده در اینترنت، مانند خبرگزاریها و ناشران، کاربران باید تعداد زیادی از این ارائهکنندهها را دنبال کنند تا نیازهای خود را برطرف نمایند. در این پایاننامه، بر روی سیستمهای پیشنهاددهنده در محیطهای چندناشری، محیطهایی با بیش از یک ارائهکننده داده، تمرکز شده است. در ابتدا سیستمهای پیشنهاددهنده چندناشری متنی در نظر گرفته شدهاند. برای این منظور یک چارچوب مبتنی بر معماری سرویسگیرنده-سرویسدهنده ارائه و با استفاده از چارچوب مدل زبانی در بازیابی اطلاعات پیادهسازی شده است. سپس دو روش بهروزرسانی شناسنامه و یک الگوریتم بهروزرسانی آستانه پیشنهاد برای بهبود کارایی سیستم ارائه گردیده است. همچنین یک روش خلاصهسازی برای کاهش ترافیک شبکه بین برنامههای سمت سرویسگیرنده و سمت سرویسدهنده پیشنهاد شده است. سپس مسأله سنجش تعامل کاربر که اخیراً به عنوان یک معیار مؤثر در سیستمهای پیشنهاددهنده معرفی شده، در نظر گرفته شده است. سنجش تعامل کاربر به معنای اندازهگیری مقدار بازخوردی است که نظرات کاربران در شبکههای اجتماعی مانند توییتر میتوانند کسب کنند. به طور دقیقتر، در این پژوهش، مسأله تشخیص توییتها با تعامل مثبت را در نظر گرفته شده است. برای این منظور، در ابتدا تعدادی ویژگی تعریف و سپس راهحلی مبتنی بر یادگیری چندوظیفهای ارائه شده است. با توجه به نامتوازنبودن دادهها، تابع اتلاف یادگیری چندوظیفهای به طوری تغییر داده شده که بتواند برای این دادهها مناسب باشد. برای ارزیابی سیستم پیشنهاددهنده متنی پیشنهادی از دو مجموعه دادهای استفاده شده است: OHSUMED و INFILE. نتایج آزمایشها نشان میدهند که روش پیشنهادی روشهای پایه را بهبود بخشیده و در محیطهای چندناشری نیز به خوبی عمل کرده است. برای ارزیابی روش پیشنهادی سنجش تعامل کاربر، در ابتدا چهار مجموعه دادهای شامل توییتهای تارنماهای IMDb، YouTube، Pandora و Goodreads جمعآوری شده است. آزمایشها کارآمدی روش چندناشری پیشنهادی را نشان میدهند.
- Abstract
- The rapid growth of the World Wide Web increases the difficulty of ?nding information related to users' information needs. To tackle this problem, recommender systems are developed to notify people about new generated items. Considering the increase in the number of data providers in the Internet, such as news agencies and publishers, users have to follow many of the data providers to satisfy their information needs. In this thesis, we focus on studying recommender systems in multi-publisher environments, environments with more than one data provider. In the first part of the thesis, multi-publisher content-based recommender systems are considered. To this aim, a framework based on client-server architecture is proposed and the framework is developed using the popular language modeling framework in information retrieval. Further, two profile updating methods and a threshold optimization algorithm are proposed to improve the recommendation performance. In addition, a summarization method is introduced to reduce the network traffic between client- and server-side applications. The next part of the thesis focuses on the user engagement evaluation problem, estimating the amount of interactions that users' opinions can achieve in social networks. User engagement has been recently considered as a measure affecting recommender systems. Specifically, we consider the problem of detecting tweets with positive engagements. To this end, a number of features are introduced and a method based on multi-task learning is proposed to transfer knowledge among domains (publishers). The loss function of multi-task learning is modified to cope with imbalanced data. To evaluate the proposed content-based recommender system, two widely used collections are considered: OHSUMED provided by TREC and INFILE provided by CLEF. The experimental results indicate that the proposed method significantly outperforms competitive baselines and performs promising in multi-publisher environments. To evaluate the proposed user engagement evaluation method, a dataset containing the tweets from IMDb, YouTube, Pandora, and Goodreads websites is created. The experiments demonstrate the effectiveness of our proposed multi-publisher method for user engagement evaluation.