عنوان پایاننامه
به کارگیری بازیابی محتوایی تصاویر به منظور سنجش شباهت ارتباطات معنایی در شبکه های اجتماعی
- رشته تحصیلی
- مهندسی فناوری اطلاعات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2996;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 76360;کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2996;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 76360
- تاریخ دفاع
- ۲۸ اردیبهشت ۱۳۹۵
- دانشجو
- بهاره هرندی زاده
- چکیده
- در هر دقیقه هزاران هزار تصویر در شبکههای اجتماعی بارگزاری میشود و به نظر میآید تمایل افراد برای بیان احساسات خود به زبان تصویر افزایش یافتهاست. حجم انبوه تصاویر ایجاد شده علاوه بر اینکه بستری برای رشد بعضی از شاخههای علوم چون بینایی ماشین را فراهم آورده، در شبکههای اجتماعی سوالات جدیدی را نیز مطرح نمودهاست که برخی از آنان قبلا در قالبهای دیگری چون متن پاسخ دادهشدهاند. Homophily و یا "دوستداشتن مشابه" یکی از این پرسشهاست که از موضوعات قدیمی در علوم اجتماعی نیز محسوب میشود. هدف این پژوهش بررسی Homophily با محوریت محتوای بصری است، به عبارت دیگر هدف آن است که بررسی شود آیا بین نزدیکی افراد در شبکه و علاقهمندی آنان به یک محتوای بصری رابطهای برقرار است یا خیر. بدین منظور ابتدا دادههای جمعآوریشده به مدت یک سال و هفت ماه توسط برنامهای به نام گتاگرام که امکان دانلود کردن تصاویر را به کاربران اینستاگرام میدهد، تجمیع شد. سپس این دادهها تمیز شده و شبکهای از افراد به همراه تصاویری که دانلود کردهبودند تشکیلشد. پس از آن خصیصههای سطح بالای تصاویر به کمک شبکههای عمیق یادگیری و خصیصههای سطح پایین به کمک برخی از الگوریتمهای رایج استخراج شدند. به منظور توصیف کاربران با استفاده از خصیصههای سطح بالا، دو روش بردار ساده و بردار اصلاح شده معرفی شد و برای یافتن شباهت میان بردارهای به دست آمده از معیار شباهت کسینوسی استفادهشد. در مورد خصیصههای سطح پایین میان هر دو تصویرِ هر دو گره در یک یال، تفاوت یا بینظمی محاسبهشد و سپس میان مقادیر بهدستآمده میانگین گرفتهشد که این مقدارِ میانگین نشاندهنده فاصله دو نود در یال است. در نهایت با تقسیم کردن کاربران به سه گروه دوستاننزدیک، دوستانلینک و غیردوستان، آزمایشهایی به منظور اثبات وجود Homophily در خصیصههای سطح بالا و پایین انجام شد. نتیجه این بررسیها نشان داد که بین شباهت در خصیصههای سطح بالای تصویر و نزدیکی افراد در شبکهاجتماعی، رابطه مستقیمی وجود دارد، همچنین این رابطه با خطای قابل بررسی برای برخی از خصیصههای سطح پایین برقرار است.
- Abstract
- Hundreds of thousands of photographs are uploaded to social networks every minute and it seems tendency of people toward expressing their feelings by sharing photos has been increased. Homophily or "Love of the same" is one of the oldest topic in social science. In this paper, we try to investigate homophily with focus on visual contents. To achieve this, we used Getagram application data, gathered for about one year and a half approximately. The collected data were cleaned and the network containing users with their corresponding images was established. After that, the images’ high-level and low-level features were extracted. In order to describe users with use of high-level vector, two approaches were proposed namely simple and modify vector and for investigating similarity between acquired vectors Cosine similarity metric has been used. About low-level features the enthropy between every pair images in each edge was calculated and then the average between all values was calculated. Finally, the three groups of users namely close-friends, link-friends and not-friends were constructed and their similarity in high and low level were calculated. The exprimens showed a clear boundary between different groups for high-level features and also debatable boundry between not-friends and friends for low-level features. Keywords: Homophily, Visual sentiment analysis, Instagram, User profiling.