عنوان پایاننامه
مطالعه بهبود کارآیی مدل یافتن نویسندگان خبره با محوریت ارتباط بین اسناد و اشخاص
- رشته تحصیلی
- علوم کتابداری و اطلاع رسانی
- مقطع تحصیلی
- دکتری تخصصی PhD
- محل دفاع
- کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 72599
- تاریخ دفاع
- ۱۷ بهمن ۱۳۹۴
- دانشجو
- هاشم عطاپور قراخانلو
- استاد راهنما
- فاطمه فهیم نیا
- چکیده
- زمینه: با استقرار و توسعه حوزه مدیریت دانش در اوایل دهه 1990 میلادی، کانون توجه بر روی توسعه نظامهای اطلاعاتی معطوف گردید که از جستجوی تخصص پشتیبانی کنند: یعنی نظامهایی که افراد صاحبدانش در حوزه موضوعی خاص را شناسایی و ارائه کند یا حوزههای تخصصی هر فرد را سیاهه نماید. این تلاشها به ایجاد نظامهایی منجر شد که به آنها نظامهای بازیابی تخصص گفته میشود. حرکت به سمت ایجاد نظامهای خودکار بازیابی تخصص موجب شد مدلهای مختلفی برای بازیابی تخصص توسعه یابند. هدف: این پژوهش مدلهای توسعهیافته در حوزه بازیابی تخصص را برای یافتن نویسندگان خبره از میان انتشارات دانشگاهی به کار گرفته و از روشهای معمول در ارزیابی نظامهای بازیابی اطلاعات، برای ارزیابی نتایج استفاده میکند. هدف آن شناسایی روشهایی است که در امر یافتن نویسندگان خبره، بهترین عملکرد را از نظر سنجههای ارزیابی نظامهای بازیابی اطلاعات دارند. روششناسی: روش پژوهش تجربی است و در کنار آن از روشهای پیمایشی و کتابخانهای نیز استفاده شده است. در پژوهش حاضر برای یافتن نویسندگان خبره مدل سند-محور خبرهیابی مبنای کار قرار گرفت و در بطن آن از مدلهای رأیدهی و رویکرد گرافمحور نیز استفاده شد. این مدل شامل دو مرحله بازیابی سند و تخصیص اسناد به افراد است. بدین منظور مجموعه آزمونی متشکل از 55 پرسوجو و 96375 مقاله نمایهشده علم اطلاعات و دانششناسی در پایگاه وب آو ساینس ایجاد شد. پرسوجوها به پیکره آزمون عرضه شد و 6 مدل مختلف بازیابی اطلاعات برای بازیابی اسناد به کار گرفته شد. اسناد بازیابی شده در معرض قضاوت ربط قرار گرفته، سپس عملکرد مدلهای بازیابی اطلاعات مورد سنجش و مقایسه قرار گرفتند. پس از مقایسه عملکرد مدلهای بازیابی اطلاعات، نتایج مدل DLH13 برای مرحله دوم انتخاب شد. اسامی افراد موجود در اسناد بازیابیشده توسط مدل منتخب استخراج و پردازش شد. سپس با به کارگیری 16 روش مختلف رتبهبندی گردید. 10 نتیجه اول هر روش انتخاب و در انبوهه نویسندگان پرسوجوی مربوطه قرار گرفت. افراد موجود در سیاهه مورد قضاوت ربط قرار گرفتند تا مقایسه عملکرد مدلهای مختلف خبرهیابی میسر شود. یافتهها: نتایج پژوهش نشان داد در مرحله بازیابی اسناد، به جز مدل زبانی هیمسترا که عملکرد ضعیف تری در مقایسه با سایر مدلها داشت، عملکرد بقیه مدلها تف
- Abstract
- Objective: This thesis applies expertise retrieval models for finding expert authors in academic publication, and uses evaluation measurements of information systems to evaluate its results. Identifying the methods that outperform other methods is the main purpose of the current research. Methodology: The research is of experimental ones and, aside from this, survey and library methods have been used in current research. this research is based on Balog’s document-centered model, and has used that model in combination with voting and graph-based models. Document-centered model is a 2-stage model:it first retrieves documents and then associate documents with people. To operationalize research goals, a new test collection was developed which includes 55 queries and 96375 documents. The queries were made by Iran Knowledge and Information Science PhD students, and the documents were papers indexed in the Web of Science database under Library Science and Information Science category. The queries were submitted to the database consisting of test collection documents, and then 6 different Information Retrieval models were used to retrieve documents from database. Retrieved documents were exposed to relevance judgment of research participant; afterwards retrieval performance of every model is measured and compared. Based on this comparison, retrieved documents by DLH13 model were chosen for second stage. All people names occurred in the retrieved documents by DLH13 were extracted and processed. Then using 16 methods, 16 different rankings of these names was created. The top 10 results of every method accumulated in a pool of authors. After relevance judgment on authors, the performance expert finding model was measured. Findings: In document retrival stage, all IR models have the same performance but the Hiemestra Language model, which has weaker performance than others. In finding expert authors, citation-based approaches outperform author-based ones. Also, there is no