عنوان پایاننامه
اجتماع کاوی تحلیلی و تشخیص ساختار جوامع در شبکه اجتماعی بوجود آمده از فضای وبلاگهای فارسی
- رشته تحصیلی
- مهندسی کامپیوتر -نرم افزار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2274;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 58917
- تاریخ دفاع
- ۰۶ مرداد ۱۳۹۲
- دانشجو
- رضا بدیع
- استاد راهنما
- مسعود رهگذر, مسعود اسدپور
- چکیده
- تحقیقات علمی نشان می دهند که خلق و خو،علایق،ویژگی هاومشخصات اساسی افراد، هم با توجه به صفات وراثتی که به آنها به ارث رسیده است و هم تأثیراتی که آنها از حضور درجامعه دریافت می کنند، شکل می گیرند. در حقیقت مشخص شده است که نوع بشر، تصمیماتش را به تنهایی نمی گیرد،بلکه روابطی که با دیگران دارد و تأثیراتی که کارهای دوستانش و یا اشخاص دیگر، بر روی او دارند، در تصمیم گیری های او بسیار تأثیرگذار هستند.وجود چنین ویژگی هایی اهمیت کاربردی تحلیل شبکه های اجتماعی را، که موضوع اصلی این پایان نامه است، به خوبی نمایان می سازد.در سال های اخیر و با تولد پایگاه های وب ارائهکننده شبکه های اجتماعی شاهد رشد روزافزون محبوبیت این پایگاه های اینترنتی بوده ایم، که با توجه به ویژگی های فطری نوع بشر، جای تعجب وشگفتی چندانی ندارد.حجم داده هایی که افراد مختلف، درارتباط با اتفاقاتی که برای آنها رخ می دهد، با یکدیگر به اشتراک می گذارند ،بانرخ قابلتوجهی افزایش داشته است.مردم با دیگران ارتباط برقرار می کنند و جنبه هایی اززندگی خصوصی خود رادر این پایگاه هاقرار می دهند. این نوع رفتار باعث می شود داده های بسیار مناسبی برای تحقیق دراختیار محققان قرار بگیرند. تاکنون تحقیقات متعددی برای اکتساب شناخت ازافراد و آن چه واقعاً دوست دارند، انجامشده است. مهمترین فعالیتی که در جریان این تحقیقات مطرح شده است، پیداکردن گروه هایی از اشخاص است که به هر دلیلی ممکن است بیشتر از سایرین بایکدیگر در ارتباط باشند. این مسئله به صورت رسمی با عنوان تشخیص ساختار جوامع در شبکه های اجتماعی، شناخته می شود. دراین پایاننامه، هدف و تاکید اصلی بر روی تشخیص ساختار جوامع هم پوشان در شبکه های اجتماعی بوده که در کارهای قبلی کمتر مورد بررسی قرار گرفته است. همچنین در جریان تحقیقات مرتبط با این پژوهش، روابط میان اشخاص نیز به صورت دودویی ساده، که در تحقیقات قبلی مرسوم بوده است، در نظر گرفته نشدهاند. بلکه معیاری برای تخمین صمیمیت موجود در بین افراد مختلف حاضر در اجتماع تعریف گردید تا روابط افراد را به صورتی نزدیکتر به آن چه که در واقعیت موجود است مورد مدل سازی قرار دهد. نتایج بررسی ها نشان می دهند که الگوریتم طراحیشده در جریان تحقیقات این پایان نامه، از لحاظ کارایی و زمان اجرا دارای برتری مشهودی بر اکثر الگوریتم های مطرحشده قبلی در این زمینه است. این برتری در نتایج معیارهای NMI، F-score و Nicosia Modularity مشهود است. همچنین با انجام بررسی های کیفی بر روی ساختار جوامع تشخیص داده شده در فضای وب نوشت های فارسی توسط الگوریتم طراحی شده، نشان داده شد که به چه میزان این الگوریتم در تشخیص ساختار جوامع توانمند و با کیفیت است. در این بررسی های کیفی، جوامع تشخیص داده شده در میان وب نوشت ها از لحاظ متنی و محتوایی مورد بررسی قرار گرفتند تا مشخص شود که میزان سازگاری موضوعی وب نوشت های عضو یک جامعه به چه میزانی است. این بررسی های محتوایی نشان دادند که درجه ی مناسبی از سازگاری در میان موضوعات مطروحه در بین اعضای یک جامعه موجود است. با انجام بررسی های عمیق تر علل تشکیل چنین جوامعی را نیز می توان شناسایی کرد.
- Abstract
- Scientifcal researches shows that humans’ interests, characteristics and attributes are shaped both from the traits they inherit and the influence they got from the presence in the society. In fact, it is known that humankind does not make its decisions alone, but the relationships he has with others and what his friends do have a high impact on what he eventually decide to do. The existence of such properties makes the practical importance of social networks analysis obvious which is the main subject of this dissertation. In recent years and with the birth of websites providing social network services, we had seen the increasing popularity of such websites. The volume of data different people share about the events that happen in their lives has increased with a tremendous speed. People constantly make new connections in these environments and provide info about different aspects of their private lives. These actions results in high quality data in vast amounts that researchers can use for their scientifical investigations. By now lots of research activities had been carried out for acquisition of knowledge about different individuals and what they really like. The most important problem that has been identified during such activities is the problem of identification of group of individuals that have formed a group with each other and for some reason, be it anything, have more interactions with each other than with the other people. Officially this problem is known as community structure identification in social networks. In this dissertation the main focus was the detection of overlapping community structures in social networks which is considered in fewer works than the disjoint community structures. Also in the present work the relationships between people is not modeled as simple binary relationships that is conventional in previous works, rather a measure for estimation of the closeness of different individuals in the society defined so it can be used for modeling the relationships between different people in society in a way that is more close to reality. The results of experimentations we done show that the designed algorithm during the related activities of this dissertation has evident superiority over the must of the previously proposed algorithms for the same purpose in this field both in term of accuracy and efficiency. Acquired values for measures like NMI, F-score and Nicosia Modularity show this superiority more obviously. Also by investigating qualitatively the quality of the identified communities by our proposed algorithm in the Persian blogosphere we have given more evidence about how good our algorithm performance is in this task. In these qualitative inspections the identified communities were examined textually to see how much consistency between the topics the members discuss about exist. Our textual examinations show there is a good consistency in the expressed topics in these weblogs. By more thorough analysis the reason of the formation of such communities can also be revealed.