عنوان پایاننامه
پیش بینی انتشار محتوا در شبکه های اجتماعی
- رشته تحصیلی
- مهندسی فناوری اطلاعات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2433;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 62785
- تاریخ دفاع
- ۲۴ دی ۱۳۹۲
- دانشجو
- علی بلالی بیدگلی
- استاد راهنما
- هشام فیلی, مسعود اسدپور
- چکیده
- امروزه استفاده از اینترنت در بین مردم بسیار رایج است به طوری که بسیاری از مردم عقاید و احساسات خود را در اینترنت منتشر میکنند. عقاید و احساسات مردم میتواند شامل نظرات در مورد یک محصول یا ارائه یک مشکل در جامعه تا مسائل شخصی باشد. یکی از زمینه های مورد علاقه محققان در چند سال اخیر استخراج اطلاعات از نظرات برای کاربرد های مختلف است. در این پژوهش دو وظیفه ی "بازسازی ساختار زنجیره گفتگو" و "پیش بینی میزان اهمیت خبر" که تمرکز بر نظرات کاربران دارند مورد توجه قرار گرفته است. اگرچه سیستم های مدیریت محتوا، نظرات را در ساختار سلسله مراتبی پشتیبانی می کنند ولی مشکل کمبود فضای صفحه، امکان نمایش ساختار کامل را فراهم نمی کند. همچنین نمایش ساختار خطی نظرات، بر اساس زمان ارسال آن ها در وب سایت ها، به دلیل سادگی در طراحی و پیادهسازی بسیار رایج است. نمایش خطی نظرات، اطلاعات زیادی را از بین می برد. راه حلی که برای حل این مشکل وجود دارد، بازسازی ساختار پاسخ ها به صورت خودکار در بین نظرات است. در قسمت اول این پژوهش، روشی به منظور پیش بینی ساختار درختی نظرات ارائه می شود که گره ها در این درخت، نظرات و یال ها، ارتباط پاسخ را نشان می دهند. قسمت دوم این پژوهش، تمرکز بر پیش بینی میزان علاقه ی مردم به مسائل مختلف جامعه دارد. به منظور رسیدن به این هدف، باید علاقه مندی های مردم در طول زمان استخراج شود و مواردی که در جذب کاربر موثر است، شناسایی شود. به منظور رسیدن به این هدف، صورت مسئله را به گونه ی دیگری که قابل حل باشد، مطرح می کنیم. تعداد نظرات بر روی یک خبر، نشان دهنده ی اهمیت آن خبر است. مردم زمانی بر روی یک خبر نظر ارسال می کنند که آن خبر را خوانده باشند و محتوای خبر برای آنها مهم باشد. بنابراین اگر بتوانیم تعداد نظرات یک خبر را قبل از انتشار پیش بینی کنیم، می توانیم میزان علاقه مندی کاربران به مسائل مختلف را تعیین کنیم. هدف ما در این قسمت، ارائه روشی است که با گرفتن اطلاعات متنی و زمانی یک خبر، بتواند میزان اهمیت آن را از دیدگاه تعداد نظر پیش بینی کند. در نهایت آزمایش های مختلفی بر اساس معیارهای ارزیابی مانند صحت و مسیر یال در قسمت بازسازی ساختار نظرات و معیار هایی مانند همبستگی پیرسون و ریشه مربع متوسط خطا برای قسمت پیش بینی میزان اهمیت خبر انجام شد. نتایج بدست آمده بهبود قابل توجهی بر اساس معیارهای ارزیابی نسبت به روش های مبنا نشان می دهند. معیار همبستگی 0.61 و ریشه مربع متوسط خطا برابر با 0.98 در پیش بینی میزان اهمیت خبر حاصل شده است.
- Abstract
- Nowadays, many people express their opinions, sentiments or ideas on the Internet. People’s sentiments or opinions can be about subjects in the form of a product or a problem in the society. In recent years, information extraction of comments becomes one of the interesting research areas. In this thesis, we focus on two important tasks, “reconstructing conversation threads for comments” and “predicting the level of importance of news”. Although content management systems nowadays allow nested comments in hierarchical order, showing the complete hierarchy might not be possible because of the space constraint. Moreover, due to the simplicity of the design and implementation, comments are usually presented as a chronologically ordered list, a presentation style in which some information is lost. A solution for this problem is to reconstruct the reply structures automatically. In the first part of this thesis, we propose a method to predict a tree structure where nodes of the tree are comments and edges show reply relations among comments. The second part of this study focuses on predicting people's interest rate to the society problems. In order to achieve this goal, we should extract the user’s favorites over time and identify features that are effective in attracting users. Since a solution to this problem is not trivial, we present the problem in a new form. The volume of comments on a news article shows its importance. Commenting on an article indicates not only the visitor has read the article but also it has been important for him. So if we can predict the volume of comments on news, we can determine the level of interest of users on various issues. The purpose of this part is proposing an approach to predict the volume of comments using textual and temporal information of news. In order to evaluate the proposed method, several experiments were performed. The results reveal salient improvement in comparison with baselines. Keywords: Reconstruction of thread structure; Text mining; Content Diffusion prediction; Comment; Social media