کاوش داده ها ی متنی با استفاده از هستانگار در برگیرنده مفاهیم کلیدی آن
- رشته تحصیلی
- مهندسی کامپیوتر- آلگوریتم ها و محاسبات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه پردیس یک فنی شماره ثبت: 15..;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 46932
- تاریخ دفاع
- ۳۰ شهریور ۱۳۸۹
- دانشجو
- مینا ملکی مجد
- استاد راهنما
- دارا معظمی
- چکیده
- داده¬های متنی اهمیت ویژه¬ای دارند و کاوش خودکار متون می¬تواند ایده و دانش نهفته درون آنها را استخراج کند. معانی موجود در متن توسط ساختار رسمی هستاننگار به مفاهیم خارج از متن متصل می¬شوند. با چارچوبی که در این پروژه معرفی می¬شود، مدلی رسمی برای متن کاوی ارائه می¬شود که نتایج حاصل از متن کاوی را مدیریت می¬کند. همچنین استفاده از مفاهیم رسمی هستاننگار در ارائه دانش پس¬زمینه، مراحل پیش¬پردازش، کشف دانش و سایر مراحل، متناسب با چارچوب پیشنهادی، یکنواخت و استاندارد می¬شود. چارچوب پیشنهادی، متون را برای ایده اصلی این پروژه در راستای تکمیل اهداف "متن کاوی با هستاننگار" آماده می¬کند. ایده پیشنهادی در پروژه کنونی، استفاده هر چه بهتر از یک هستاننگار در فعال ساختن آن دسته از مفاهیم کلیدی در متن است که از قابلیت تعمیم ویژه¬ای برخوردار باشند. استفاده از این قابلیت تعمیم سبب می¬گردد تا مفاهیم مربوطه همزمان از قابلیت تبدیل به مفاهیم در حد کافی مجرد نیز بهره¬مند گردند. هستاننگار پیشنهای حاوی مجموعه¬ای از مفاهیم و خواص مرتبط با آن بوده، که وجود این خواص سبب می¬گردد تا فضای متن در خصوص مفاهیم کلیدی یاد شده، قابل وارسی گردد. چارچوب و الگوریتم پیشنهادی در دامنه پزشکی بر روی متون مربوط به بیماران امتحان می¬گردند تا استفاده از نتایج الگوریتم پیشنهادی برای اتخاذ سیاست سلامت نشان داده شود.
- Abstract
- Textual data are particularly important and automatic text mining can extract knowledge that is hidden within them. By the formal model of ontology, Meaning in the text can be connected to concepts which are not in the text. With the framework which offered in this thesis a formal model for text mining will be introduced. Also use of formal model ontology will be uniformed and standardized in presenting of background knowledge, preprocessing steps, knowledge discovery and other steps according to proposed framework. The proposed framework prepares the text for the main idea of this thesis in order to complete the goals of text mining with ontology. The idea proposed in the current project is the best using of ontology in activation the key concepts existing in the text which have special generalization capability. Using this generalization capability causes these concepts to have the ability of being converted to abstract enough concepts. The proposed ontology has a set of concepts and properties related to it that by existing of these properties the text will be able to be checked according to already mentioned key concepts. The proposed framework and algorithm will be examined in Biomedical domain on texts related to patients by which will demonstrate the use of results obtained from the algorithm for health policies.