عنوان پایان‌نامه

پردازش مفهومی مبتنی بر قاب جهت استخراج نکات کلیدی و حقایق از متون



    دانشجو در تاریخ ۱۲ اسفند ۱۳۸۹ ، به راهنمایی ، پایان نامه با عنوان "پردازش مفهومی مبتنی بر قاب جهت استخراج نکات کلیدی و حقایق از متون" را دفاع نموده است.


    محل دفاع
    کتابخانه پردیس یک فنی شماره ثبت: 18..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 47385
    تاریخ دفاع
    ۱۲ اسفند ۱۳۸۹

    با توجه به رشد روزافزون اسناد الکترونیکی ،یافتن اسنادی که مرتبط با نیاز کاربر باشد به یک مسئل? سخت و دشوار تبدیل شده است. بنابراین نیاز به دسترسی آسان و سریع به این منابع اطلاعاتی ،به شدت احساس می¬شود. بر اساس این نیاز پژوهشگران زیادی در دهه¬های اخیر اقدام به طراحی و پیاده¬سازی سیستم¬های خلاصه¬سازی و استخراج عبارات و نکات کلیدی بصورت خودکار کرده¬اند. در واقع نکات کلیدی یک متن در برگیرند? اصلی¬ترین و مهم¬ترین مفاهیم موجود در متن، بصورت خیلی کوتاه¬تر و فشرده¬تر از متن اصلی می-باشند بطوری که بررسی آنها زمان مصرفی کاربران را چندین برابر کاهش می¬دهد. بنابراین ما در این پروژه اقدام به طراحی سیستم خودکار استخراج نکات کلیدی موجود در متن با استفاده از زنجیره¬های لغوی می¬کنیم.در این سیستم از مجموعه داده¬های موجود در FrameNet جهت تبدیل ساختار نحوی متن به ساختار معنایی و یافتن روابط بین این مفاهیم، استفاده می¬کنیم. در نهایت به مجموعه¬ای از چندتایی ها می¬رسیم که شامل مفهوم مورد نظر و عناصر معنایی مرتبط با آن است. با بکار بردن تعمیم جز به کل می¬توان به مفاهیمی رسید که یک سطح بالاتر از مفاهیم موجود در متن اصلی هستند. تاکنون کارهای زیادی در زمین? تولید خلاص? متن و استخراج عبارات کلیدی موجود در متن، با استفاده از زنجیره¬های لغوی انجام شده است اما در زمین? استخراج نکات کلیدی سیستمی طراحی نشده است. همچنین ما در این پروژه، برای اولین بار از هستاننگار FrameNet جهت تولید زنجیره¬های لغوی استفاده می¬کنیم. این هستاننگار چون در برگیرند? مفاهیم موجود در متن می¬باشد، قطعا مناسب¬ترین بانک اطلاعاتی را جهت استخراج مفاهیم کلیدی متن فراهم می¬کند. با مقایس? خروجی این سیستم با چکیده¬های تولید شده توسط خبره به نتایج قابل قبولی می¬رسیم. در ..... درصد موارد، مفاهیم تولیدشده توسط سیستم با مفاهیم استخراج¬شده توسط خبره، مطابقت دارد که با توجه به تازگی کار، همچنان امکان بهبود این سیستم وجود دارد.
    Abstract
    In according to increase of electronic documents , finding document that related to user’s needed is very difficult. So we need a system for easy and fast access to this data source. In recent decade , many Researchers designed and implemented automatic systems for summarization and extracting key phrases and key points. In fact, key points include the most important idea in original text at the brief form , decrease the time that users spend. So in this thesis, we design the automatic system for extracting key points by using lexical chains. In this system, we use FrameNet for shallow semantic parsing of texts. Finally, we will present the set of tuples that contain important concept of the original text with related semantic roles. With use of generalization from parts on to whole, we can extract a concept at the higher level. Till now, many researches have done in the area of summarization and key phrase extraction but in key points extraction, haven’t. In this thesis, for the first time, lexical chains have constructed with FrameNet ontology . When we compare output of this system with human abstract, achieve the good results. in 38 Percent the concept that generate by this system is equal to concept that human generated. This system can be extended in the future. Keywords: automatic summarization, lexical chain, keyphrases extraction, generalization from parts to whole