عنوان پایان‌نامه

پردازش مفهومی متن به منظور استخراج نکات کلیدی



    دانشجو در تاریخ ۱۳ شهریور ۱۳۹۲ ، به راهنمایی ، پایان نامه با عنوان "پردازش مفهومی متن به منظور استخراج نکات کلیدی" را دفاع نموده است.


    محل دفاع
    کتابخانه پردیس یک فنی شماره ثبت: 46..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 60183
    تاریخ دفاع
    ۱۳ شهریور ۱۳۹۲

    پردازش مفهومی متن یکی از مهم ترین موضوعات پژوهشی در زمینه متن کاوی است که می تواند برای استخراج اطلاعات، پیام‌ها، نکات کلیدی و یا چکیده از متن مورد استفاده قرار گیرد. تا کنون رویکردهای بسیاری برای استخراج اطلاعات از متن معرفی شده اند ولی، فقدان معنا و مفهوم در نمایش نتایج نهایی اکثر آن‌ها مشهود است. در این پژوهش چارچوبی برای استخراج نکات کلیدی از متن بر اساس پردازش مفهومی ارائه شده است که از سه رویکرد "استخراج زنجیره‌های لغوی"، "استخراج قاب‌های معنایی" و "قطعه‌یابی معنایی در متن" بهره گرفته است. برای نخستین بار مفاهیم "قالب معنایی"، "جریان معنایی" و "بردار مبین" معرفی شده است. در چارچوب پیشنهادی از رویکردهای "استخراج زنجیره‌های لغوی"و"استخراج قاب‌های معنایی" برای استخراج اطلاعات پیش نیاز در مرحله پیش پردازش استفاده شده است. بردارهای مبین اولیه با استفاده از نتایج پیش پردازش تشکیل می‌شوند. از مفاهیم قالب معنایی و جریان معنایی برای تصمیم گیری در مورد تغییر معنا در قطعه‌های مختلف متن کمک گرفته شده است. به عبارت دیگر با تعیین جریان‌های معنایی موجود می‌توان قطعه‌های معنایی و مرز آن‌ها و همچنین روابط معنایی بین آن‌ها را شناسایی کنیم. در آخرین مرحله برای نمایش نکات کلیدی استخراج شده به عنوان نتیجه، با ترسیم گرافی از متن که نشان دهنده جریان‌های معنایی موجود در متن است، نکات کلیدی استخراج شده به صورتی قابل درک برای کاربر نمایش داده می شود. برای ارزیابی چارچوب ارائه شده، نکات کلیدی استخراج شده به عنوان نتیجه با نظر خبره مقایسه شده است و ارزیابی با درنظرگرفتن معیارهای "دقت"، "یادآوری یا فراخوانی" و اندازه F صورت گرفته است. در 69% موارد، نکات کلیدی استخراج شده به نظر خبره نزدیک بوده است.
    Abstract
    Conceptual processing of text is an important issue in text mining, which can be used for extracting messages and focal points from a text. Many approaches have been introduced to extract information from text but, most of them suffer from a semantic lack in the presentation of final results. According to huge amount of documents, we need some semantic approaches to extract text messages. In this thesis, a framework has been proposed to extract key points from texts based on a kind of conceptual processing. Here three approaches; lexical chain extraction, semantic frame extraction and text segmentation are used. Extraction of lexical chains and semantic frames is in reality performed (as a processing stage) to extract the prerequisites essential to the post processing. Having performed these phases, “identity vectors” are constituted to save the information essential to subsequent decisions. In this thesis, for the first time the concepts “semantic format” and “semantic stream” are introduced to help determine semantic drift in the text. In other words through determining semantic streams, we will be able to identify appropriate text segments, their boundaries, as well as some semantic relations that may exist between different segments or subtopics. These relations can then yield text messages and focal points. To present the output we draw the semantic graph of the text to represent key points in a way understandable for human users. We assessed our framework using precision, recall and Fmeasure criteria. Experiments demonstrate that an average of #O% of results are close to those obtained by human perception. Keywords: Text mining, key point extraction, semantic format, semantic drift, semantic stream, conceptual text processing