عنوان پایاننامه
تشابه یابی متون متنی با استفاده از ارتباط معنایی
- رشته تحصیلی
- مهندسی کامپیوتر- آلگوریتم ها و محاسبات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس یک فنی شماره ثبت: 106..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 79566;کتابخانه پردیس یک فنی شماره ثبت: 106..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 79566
- تاریخ دفاع
- ۱۶ شهریور ۱۳۹۵
- دانشجو
- مسعود کزازی
- استاد راهنما
- علی معینی
- چکیده
- پردازش متن از جمله مسائل اساسی در حوزه هوش مصنوعی و شناخت رایانشی است، که در چند دهه اخیر، توجهات گسترده ای را در قالب های عدیده به خود معطوف کرده است. یکی از شاخه های پردازش متن، تفسیر متن است که به بررسی ارتباط معنایی بین متون می پردازد. جهت بررسی میزان ارتباط معنایی بین دو متن ورودی از ویکی پدیا فارسی استفاده نمودیم. نحوه استفاده آن بدین صورت است که به ازای هر متن ورودی، برداری براساس اسناد موجود در ویکی پدیا تشکیل می شود که هر درایه آن مشخص می کند متن ورودی چه میزان شبیه به اسناد موجود در پایگاه دانش است سپس جهت مشخص شدن میزان ارتباط معنایی بین متون ورودی، بردارهای تشکیل شده را با هم مقایسه و به عددی که بیانگر میزان شباهت بین دو متن ورودی است، دست پیدا می کنیم. همچنین جهت افزایش دقت کار ما از کلمات هم معنی دسته بندی شده استفاده کردیم. برای این منظور لازم است ابتدا پایگاه دانش ویکی پدیا فارسی را دریافت نموده و تجزیه ای بر روی آن صورت پذیرد. و همچنین جهت مشخص کردن عملکرد کار ارائه شده، تعداد چند جفت سند را تهیه کردیم و با مشخص کردن موضوع آنها در اختیار کاربران قرار دادیم تا میزان ارتباط معنایی آنها را مشخص نمایند و میانگین درصد میزان شباهت متون بررسی شده کاربران به ازای هر جفت سند را به عنوان معیار میزان شباهت آن جفت سند در نظر گرفتیم و در نهایت با خروجی تولید شده از الگوریتم ارائه شده مقایسه نمودیم. استفاده از روش فوق باعث گردید که بررسی میزان ارتباط معنایی بین متون با استفاده از روش فوق به 66 درصد برسد.
- Abstract
- Computing semantic relatedness of natural language texts requires access to vast amounts of common-sense and domain-specific Wikipedia knowledge. Assessing the relatedness of texts in this space amounts to comparing the corresponding vectors using conventional metrics. Compared with the previous state of the art, using ESA with synonymous words led to correlation of computed relatedness scores with human judgments achieve %66 percent. Keywords: Information Retrieval, position of speech, machine learning, Indexing, correlation, vector space , Explicit semantic analysis, Semantic Context Vector, Concept-base information retreival