عنوان پایاننامه
ارائه چارچوبی فردی - اجتماعی برای مدلسازی انتشار در توییتر
- رشته تحصیلی
- مهندسی کامپیوتر- هوش مصنوعی - رباتیک
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2776;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 70177
- تاریخ دفاع
- ۰۳ شهریور ۱۳۹۴
- دانشجو
- محمد مهدوی لاهیجانی
- استاد راهنما
- مسعود اسدپور
- چکیده
- با پیدایش شبکههای اجتماعی برخط، افراد عادی بیش از پیش این امکان را یافتهاند تا به تولید محتوا بپردازند. اما با افزایش روزافزون این محتواها، اهمیت شناسایی جذابترین آنها نیز افزایش یافته است. بنابراین یک پرسش اساسی مطرح میشود که در کل «چه محتواهایی جذابتر خواهند بود؟». در این پایاننامه این مسئله با ارائه یک تحلیل فراگیر بر محتوای توییتهای کاربران توییتر و اثر ویژگیهای آن بر پیشبینی محبوبیت توییتها و تشخیص موضوع آنها، پاسخ داده خواهد شد. محتوای توییتها را میتوان به دو دسته محتواهای فردی که در ارتباط با دغدغههای نویسنده توییت هستند و محتواهای اجتماعی که دغدغههای کلی جامعه را بیان میکنند، تقسیم نمود. ایده اصلی این پژوهش این است که تشخیص فردی یا اجتماعی بودن محتوا، در بهبود دقت روشهای پیشبینی محبوبیت و تشخیص موضوع توییتها، اثرگذار خواهد بود. در این پژوهش ابتدا یک مجموعهدادگان مناسب از توییتهای فارسی توییتر جمعآوری شده و تعداد بازتوییت آنها به عنوان معیار محبوبیتشان، در نظر گرفته شده است. سپس برای دستیابی به ویژگیهای معنایی محتوای توییتها، یک فرآیند برچسبگذاری تعریف شده و بردار ویژگی گستردهای از ویژگیهای واژگانی و معنایی توییتها ایجاد شد. در ادامه از این مجموعهدادگان در وظایف پیشبینی کلاس محبوبیت توییتها و همچنین تشخیص موضوع آنها استفاده شده است. بر اساس نتایج به دست آمده، ویژگیهای مرتبط با مضامین اجتماعی، همبستگی بیشتری با محبوبیت توییتها دارند. درواقع از آنجا که بازتوییت به عنوان معیار محبوبیت توییتها، خود کنشی اجتماعی به حساب میآید، از منظر این معیار، محتواهای فردی کمتر برای کاربران دیگر جذاب بوده و در مقابل، محتواهای اجتماعی بسیار بیشتر برای انجمن کاربران محبوب خواهند بود. همچنین در حوزه تشخیص موضوع، آگاهی از فردی یا اجتماعی بودن محتوای توییتها، امکان شناسایی دقیقتر موضوع توییتها را فراهم آورده است. واژههای کلیدی: شبکههای اجتماعی برخط، توییتر، محتوای توییت، تشخیص محبوبیت، پیشبینی بازتوییت، تشخیص موضوع
- Abstract
- By the appearance of online social networks, individuals have found more chances and more facilities to publish contents. But, as the volume of these contents grows, the importance of detection of attractive ones increases. So, an important question is “what is an attractive content for public?”. In this project this question is investigated by performing a comprehensive analysis of tweet content. In fact, the impacts of content-based features on the prediction of popularity and detection of topics are studied. The contents of tweets can be classified into individual and social contents. Individual contents are usually author’s concerns about his/her events. Social contents discuss about topics and events that concern society. The main idea is that detecting individual and social contents can improve performance of popularity prediction and topic detection methods. Thus, a sample of Persian tweets was collected and the number of retweets of each tweet was considered as popularity measure. Then, an annotation process for accessing the semantic features of tweets was defined and the feature vector was formed by the lexical and semantic features. The results of experiments indicate that social related features have more correlation with the popularity of tweets. Since retweeting is a social act, so regarding this measure, social contents are more popular in society. Besides, detecting individual and social contents helped improve precision of topic detection methods. Keywords: Online Social Networks, Twitter, Tweet Content, Popularity Detection, Retweet Prediction, Topic Detection