عنوان پایاننامه
ارائه ی یک ساختار برای تعیین جهت گیری نظرات در رسانه های اجتماعی
- رشته تحصیلی
- مهندسی فناوری اطلاعات - سامانه های شبکه ای
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 73647;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 73647
- تاریخ دفاع
- ۱۷ بهمن ۱۳۹۴
- دانشجو
- حسین اکبریان
- استاد راهنما
- مصطفی صالحی, هادی ویسی
- چکیده
- با ظهور وب 2.0 نظرات نوشته شده توسط کاربران به یکی از مهمترین موضوعات در شبکهها و رسانههای اجتماعی تبدیل شده است. نظرات کاربران در این رسانهها حجم گستردهای از اطلاعات را فراهم میکند، با این وجود گاه سبب ایجاد جریانهای سیاسی و اجتماعی و گمراهی سایر کاربران میشود. همچنین نظرات کاربران در ارتباط با محصولات یک فروشگاه برخط به عنوان یکی از مهمترین رسانههای اجتماعی راهنمای مناسبی برای سایر کاربران میباشد. زیرا نظرات کاربران تاثیر بسزایی در ایجاد اعتماد بین کاربران و این فروشگاهها دارد. با این وجود حجم انبوه نظرات میتواند منجر به گمراهی خریدار و خرید محصول نامناسب شود. از این رو حوزهی نظرکاوی به عنوان یک حوزهی پژوهشی مورد توجه بسیاری از پژوهشگران قرار گرفته است. نظرکاوی با استفاده از معیارهای مختلف نظرات کاربران را دستهبندی نموده و در این راستا دارای زیرشاخههای مختلفی میباشد. یکی از مهمترین شاخههای نظرکاوی تعیین جهتگیری نظرات میباشد. در این شاخه نظرات کاربران در رسانههای اجتماعی در مورد یک موجودیت (محصول، خبر) مورد بررسی قرار میگیرد، و مثبت یا منفی بودن آن تعیین میشود. پژوهشهای مختلفی در زمینهی تعیین جهتگیری نظرات در زبان انگلیسی صورت گرفته است. با این وجود روشهای مورد استفاده در این پژوهشها در زبان فارسی به دلیل ساختار متفاوت با سایر زبانها دقت پایینی دارد. از این رو در این پایاننامه روشی ارائه نمودهایم، تا علاوه بر بهبود در مرحلهی پیشپردازش و یادگیری ماشین با ارائهی ویژگیهای جدید مشکلات پژوهشهای پیشین برطرف شود. برای تحقق این هدف ویژگیهای لغتنامه و فراوانی وزنی را به عنوان روش پایه مورد استفاده قرار دادهایم. سپس برای رفع مشکلات نظرات با حجم کلمات زیاد از جملات اول و آخر که تاثیر مهمی در جهتگیری نظرات دارد، استفاده نمودهایم. در این راستا جملات اول و آخر را استخراج نموده با استفاده از الگوریتمهای یادگیری ماشین جهتگیری جملات اول و آخر را تعیین نموده و به عنوان یک ویژگی از کل نظر در نظر گرفتهایم. همچنین با ارائهی شش الگوی نحوی در زبان فارسی جهتگیری عبارات درون نظر را شناسایی نمودهایم. به وسیلهی این الگوهای نحوی میتوان عباراتی که کلمات آن به تنهایی دارای جهتگیری نیست، اما کل عبارات دارای جهتگیری میباشد را استخراج نمود.
- Abstract
- Nowadays, user reviews to be one of the most important issues in social media. User reviews in social media creates huge amount of information. This reviews sometimes caused the political or social stream or mislead other users in social media. Neverthless this reviews in online shopping websites as one of the most important types of social media has many applications. Customer reviews used as a guide for other users and increase trust between users and online shopping websites. Thus as one of the most important research areas, opinion mining is a research area that uses diffrent criteria to classify the user reviews. Polarity detection is one of the most important fields of opinion mining, that determine polarity of user reviews (Negative or Positive). Previos studies in polarity ditection have been cunducted to detrmine polarity of the reviews in English language. Neverthless, using this methods in Persian language Leads to low accuracy. So in this thesis we improved pre-processing and machine learning phases. Also we introduce new feature to improve problem of the previous research. we use dictionary and TF-IDF feature as basic features. Then we use first and last sentence and syntatic feature to solve the problem of reviews with many word. In this regard, we extracted first and last sentences and used machine learning algorithms to determine the polarity of them. Then we develope this sentence polarity as review feature. Also we offered six syntatic rules to determine phrase polarity. As a result the extraction of this phrases can determine the polarity of many folk reviews. we used "Digikala" reviews For evolution phase. also We found that after using location and syntatic features and basic features, we can improve accuracy to 87.49.