عنوان پایان‌نامه

ارائه چارچوبی فردی - اجتماعی برای مدلسازی انتشار در توییتر



    دانشجو در تاریخ ۰۳ شهریور ۱۳۹۴ ، به راهنمایی ، پایان نامه با عنوان "ارائه چارچوبی فردی - اجتماعی برای مدلسازی انتشار در توییتر" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2776;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 70177
    تاریخ دفاع
    ۰۳ شهریور ۱۳۹۴
    استاد راهنما
    مسعود اسدپور

    با پیدایش شبکه‌های اجتماعی برخط، افراد عادی بیش از پیش این امکان را یافته‌اند تا به تولید محتوا بپردازند. اما با افزایش روزافزون این محتواها، اهمیت شناسایی جذاب‌ترین آن‌ها نیز افزایش یافته است. بنابراین یک پرسش اساسی مطرح می‌شود که در کل «چه محتواهایی جذاب‌تر خواهند بود؟». در این پایان‌نامه این مسئله با ارائه یک تحلیل فراگیر بر محتوای توییت‌های کاربران توییتر و اثر ویژگی‌های آن بر پیش‌بینی محبوبیت توییت‌ها و تشخیص موضوع آن‌ها، پاسخ داده خواهد شد. محتوای توییت‌ها را می‌توان به دو دسته محتواهای فردی که در ارتباط با دغدغه‌های نویسنده توییت هستند و محتواهای اجتماعی که دغدغه‌های کلی جامعه را بیان می‌کنند، تقسیم نمود. ایده اصلی این پژوهش این است که تشخیص فردی یا اجتماعی بودن محتوا، در بهبود دقت روش‌های پیش‌بینی محبوبیت و تشخیص موضوع توییت‌ها، اثرگذار خواهد بود. در این پژوهش ابتدا یک مجموعه‌دادگان مناسب از توییت‌های فارسی توییتر جمع‌آوری شده و تعداد بازتوییت آن‌ها به عنوان معیار محبوبیت‌شان، در نظر گرفته شده است. سپس برای دستیابی به ویژگی‌های معنایی محتوای توییت‌ها، یک فرآیند برچسب‌گذاری تعریف شده و بردار ویژگی گسترده‌ای از ویژگی‌های واژگانی و معنایی توییت‌ها ایجاد شد. در ادامه از این مجموعه‌دادگان در وظایف پیش‌بینی کلاس محبوبیت توییت‌ها و هم‌چنین تشخیص موضوع آن‌ها استفاده شده است. بر اساس نتایج به دست آمده، ویژگی‌های مرتبط با مضامین اجتماعی، هم‌بستگی بیشتری با محبوبیت توییت‌ها دارند. درواقع از آن‌جا که بازتوییت به عنوان معیار محبوبیت توییت‌ها، خود کنشی اجتماعی به حساب می‌آید، از منظر این معیار، محتواهای فردی کمتر برای کاربران دیگر جذاب بوده و در مقابل، محتواهای اجتماعی بسیار بیشتر برای انجمن کاربران محبوب خواهند بود. هم‌چنین در حوزه تشخیص موضوع، آگاهی از فردی یا اجتماعی بودن محتوای توییت‌ها، امکان شناسایی دقیق‌تر موضوع توییت‌ها را فراهم آورده است. واژه‌های کلیدی: شبکه‌های اجتماعی برخط، توییتر، محتوای توییت، تشخیص محبوبیت، پیش‌بینی بازتوییت، تشخیص موضوع
    Abstract
    By the appearance of online social networks, individuals have found more chances and more facilities to publish contents. But, as the volume of these contents grows, the importance of detection of attractive ones increases. So, an important question is “what is an attractive content for public?”. In this project this question is investigated by performing a comprehensive analysis of tweet content. In fact, the impacts of content-based features on the prediction of popularity and detection of topics are studied. The contents of tweets can be classified into individual and social contents. Individual contents are usually author’s concerns about his/her events. Social contents discuss about topics and events that concern society. The main idea is that detecting individual and social contents can improve performance of popularity prediction and topic detection methods. Thus, a sample of Persian tweets was collected and the number of retweets of each tweet was considered as popularity measure. Then, an annotation process for accessing the semantic features of tweets was defined and the feature vector was formed by the lexical and semantic features. The results of experiments indicate that social related features have more correlation with the popularity of tweets. Since retweeting is a social act, so regarding this measure, social contents are more popular in society. Besides, detecting individual and social contents helped improve precision of topic detection methods. Keywords: Online Social Networks, Twitter, Tweet Content, Popularity Detection, Retweet Prediction, Topic Detection