عنوان پایاننامه
تجزیه و تحلیل روابط زمانی پیش آمدهای فعلی بر حسب وجه و نمود رویکرد پیکره ای
- رشته تحصیلی
- زبانشناسی همگانی
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه دانشکده ادبیات و علوم انسانی شماره ثبت: 43600;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 50602
- تاریخ دفاع
- ۲۹ آذر ۱۳۹۰
- دانشجو
- لادن جبهه
- استاد راهنما
- محمود بی جن خان
- چکیده
- پایان¬نامه حاضر، پژوهشی در حوزه پردازش زبان طبیعی و زبان¬شناسی رایانه¬ای است که به بررسی روابط زمانی در متون پیکره زبان فارسی معاصر می¬پردازد. بازشناسایی خودکار رویدادها و روابط زمانی، در سیستم¬های پردازش زبان طبیعی مانند سیستم¬های خلاصه¬سازی متنو پرسش و پاسخ، که نیازمند استنتاج زمانی هستند، از اهمیت بسیار بالایی برخوردار است.طراحی سیستم¬هایی که توانایی درک روابط زمانی بین رویدادها را داشته باشند مستلزم تولید پیکره¬هایی است که در آن¬ها برچسب رویدادها و زمان موجود باشد. تعیین روابط زمانی در متون گاه از طریق اطلاعات بافتی و دانش جهان خارج و گاه از طریق الگوهای ساختاریو نحوی جملات و یا عناصری که در متن دارای تظاهر واژگانی هستند صورت می¬گیرد. از جمله عناصر واژگانی که در تحلیل روابط زمانی موٌثرند، می¬توان به حروف ربط زمان اشاره کرد. در این تحقیق، پس از ارائه مبانی نظری در حوزه زمان و وجه رویدادهای فعلی، به معرفی پیکره¬های متنی و به¬خصوص پیکره متنی زبان فارسی در تعیین نوع روابط زمانی و برچسب¬دهی خودکار آن¬ها می¬پردازیم. در تعیین روابط زمانی بین رویدادها به بررسی پیکره-بنیاد نقش سیگنال¬ها و وجه رویدادهای فعلی در دو مرحله جداگانه می¬پردازیم و تلاش می¬شود تا میزان دقت پیش¬بینی به¬وسیله هریک سنجیده شود و در ادامه با توجه به نتایج داده¬ها و مباحث نظری به ارائه نتیجه نهایی خواهیم پرداخت.
- Abstract
- This article investigates temporal relations in the Persian Corpus within the framework of natural language processing and computational linguistics. Automatic recognition of events and temporal relations is demonstrably crucial in natural language processing systems, such as text summarization and question answering systems, to which temporal inference is an integral necessity. Designing systems capable of understanding temporal relations between events demands temporally annotated corpora. Determining temporal relations often requires both linguistic and non-linguistic knowledge. In addition, lexico-syntactic clues in a text can contribute to temporal inference. Conjunctions are among the lexical clues that can influence temporal relations in a text. The TimeBank corpus represents the most fine-grained temporally annotated corpus to date which is annotated based on the TimeML markup languae. In this study, after an introduction to the concept of event and temporal relations, the TimeBank, the timeML, and the Contemporary Persian Corpus, which is annotated in accordance with the EAGLES (Expert Advice Group for Language Engineering Standards) will be introduced. Subsequently, TimeML standards of temporal relations will be applied to the Persian Corpus tensed-verb events. Signals (temporal conjunctions) will have to be extracted from the total of conjunctions, in the first place. Second, the corresponding documents need to be extracted from the corpus. Then temporal relations between the tensed verbs of the documents have to be investigated and the role of signals in the identification of those relations must be scrutinized. The study of the role of signals in the prediction of temporal relations will be carried out in two stages, according to the two classifications of temporal relations by James Allen and and verb mood by Hooper, respectively. The statistical analysis of the data will show that Hooper’s classification of verb mood leads to better results in terms of temporal relation identification.