عنوان پایان‌نامه

سیستمهای پیشنهاد دهنده برای محیطهای چند ناشری



    دانشجو در تاریخ ۲۲ تیر ۱۳۹۴ ، به راهنمایی ، پایان نامه با عنوان "سیستمهای پیشنهاد دهنده برای محیطهای چند ناشری" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2714;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 68982
    تاریخ دفاع
    ۲۲ تیر ۱۳۹۴
    دانشجو
    حامد زمانی
    استاد راهنما
    آزاده شاکری

    گسترش سریع اینترنت یافتن اطلاعات مرتبط با نیازهای کاربران را با سختی روبه‌رو کرده است. برای حل این مشکل، سیستم‌های پیشنهاددهنده ارائه شده‌اند که کاربران را از وجود اقلام جدید باخبر می‌کنند. با توجه به افزایش تعداد ارائه‌کننده‌های داده در اینترنت، مانند خبرگزاری‌ها و ناشران، کاربران باید تعداد زیادی از این ارائه‌کننده‌ها را دنبال کنند تا نیازهای خود را برطرف نمایند. در این پایان‌نامه، بر روی سیستم‌های پیشنهاددهنده در محیط‌های چندناشری، محیط‌هایی با بیش از یک ارائه‌کننده داده، تمرکز شده است. در ابتدا سیستم‌های پیشنهاددهنده چندناشری متنی در نظر گرفته شده‌اند. برای این منظور یک چارچوب مبتنی بر معماری سرویس‌گیرنده-سرویس‌دهنده ارائه و با استفاده از چارچوب مدل زبانی در بازیابی اطلاعات پیاده‌سازی شده است. سپس دو روش به‌روزرسانی شناسنامه و یک الگوریتم به‌روزرسانی آستانه پیشنهاد برای بهبود کارایی سیستم ارائه گردیده است. همچنین یک روش خلاصه‌سازی برای کاهش ترافیک شبکه بین برنامه‌های سمت سرویس‌گیرنده و سمت سرویس‌دهنده پیشنهاد شده است. سپس مسأله سنجش تعامل کاربر که اخیراً به عنوان یک معیار مؤثر در سیستم‌های پیشنهاددهنده معرفی شده، در نظر گرفته شده است. سنجش تعامل کاربر به معنای اندازه‌گیری مقدار بازخوردی است که نظرات کاربران در شبکه‌های اجتماعی مانند توییتر می‌توانند کسب کنند. به طور دقیق‌تر، در این پژوهش، مسأله تشخیص توییت‌ها با تعامل مثبت را در نظر گرفته شده است. برای این منظور، در ابتدا تعدادی ویژگی تعریف و سپس راه‌حلی مبتنی بر یادگیری چندوظیفه‌ای ارائه شده است. با توجه به نامتوازن‌بودن داده‌ها، تابع اتلاف یادگیری چندوظیفه‌ای به طوری تغییر داده شده که بتواند برای این داده‌ها مناسب باشد. برای ارزیابی سیستم پیشنهاددهنده متنی پیشنهادی از دو مجموعه داده‌ای استفاده شده است: OHSUMED و INFILE. نتایج آزمایش‌ها نشان می‌دهند که روش پیشنهادی روش‌های پایه را بهبود بخشیده و در محیط‌های چندناشری نیز به خوبی عمل کرده است. برای ارزیابی روش پیشنهادی سنجش تعامل کاربر، در ابتدا چهار مجموعه داده‌ای شامل توییت‌های تارنماهای IMDb، YouTube، Pandora و Goodreads جمع‌آوری شده است. آزمایش‌ها کارآمدی روش چندناشری پیشنهادی را نشان می‌دهند.
    Abstract
    The rapid growth of the World Wide Web increases the difficulty of ?nding information related to users' information needs. To tackle this problem, recommender systems are developed to notify people about new generated items. Considering the increase in the number of data providers in the Internet, such as news agencies and publishers, users have to follow many of the data providers to satisfy their information needs. In this thesis, we focus on studying recommender systems in multi-publisher environments, environments with more than one data provider. In the first part of the thesis, multi-publisher content-based recommender systems are considered. To this aim, a framework based on client-server architecture is proposed and the framework is developed using the popular language modeling framework in information retrieval. Further, two profile updating methods and a threshold optimization algorithm are proposed to improve the recommendation performance. In addition, a summarization method is introduced to reduce the network traffic between client- and server-side applications. The next part of the thesis focuses on the user engagement evaluation problem, estimating the amount of interactions that users' opinions can achieve in social networks. User engagement has been recently considered as a measure affecting recommender systems. Specifically, we consider the problem of detecting tweets with positive engagements. To this end, a number of features are introduced and a method based on multi-task learning is proposed to transfer knowledge among domains (publishers). The loss function of multi-task learning is modified to cope with imbalanced data. To evaluate the proposed content-based recommender system, two widely used collections are considered: OHSUMED provided by TREC and INFILE provided by CLEF. The experimental results indicate that the proposed method significantly outperforms competitive baselines and performs promising in multi-publisher environments. To evaluate the proposed user engagement evaluation method, a dataset containing the tweets from IMDb, YouTube, Pandora, and Goodreads websites is created. The experiments demonstrate the effectiveness of our proposed multi-publisher method for user engagement evaluation.