عنوان پایاننامه
شناسایی خبره بر اساس دامنه موضوعات سلسه مراتبی
- رشته تحصیلی
- مهندسی کامپیوتر -نرم افزار
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2839;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71709
- تاریخ دفاع
- ۰۸ شهریور ۱۳۹۴
- استاد راهنما
- مریم السادات میریان حسین آبادی, آزاده شاکری
- دانشجو
- مرجان عظیمی
- چکیده
- با رشد روزافزون اطلاعات و افزایش شاخههای علوم، تسلط کامل یک فرد بر همهی مطالب و حرکت با سرعت لازم در جهت بهروز بودن در همهی این شاخهها امری غیرممکن به نظر میرسد. بنابراین نیاز است تا افرادی علاقهمند در هر زمینه وجود داشته باشند تا افزون بر داشتن دانش و مهارت کافی در آن زمینه بتوانند همگام با این پیشرفت حرکت نمایند و دانش خود را به دیگران انتقال دهند. به افرادی که قادر به برآورده کردن نیازهای اطلاعاتی در زمینهای خاص، دادن پاسخ صحیح به سوالات در آن زمینهی خاص و یا توضیح آنها میباشند خبره گفته میشود. خبرهیابی شناسایی افرادی است که از دانش و مهارت کافی در یک زمینهی تخصصی برخوردارند. روشهای سنتی موجود برای بازیابی خبره، معمولا ارتباط بین پرسوجو و اسناد پشتیبان کاندیدای خبرگی را از طریق محاسبهی فرکانس رخداد کلمات پرسوجو در اسناد پشتیبان وی تخمین میزنند. این در حالی است که این شیوهی محاسبهی ارتباط، فاقد توانایی شناسایی اطلاعات معنایی میباشد. این مساله موجب میشود، برخی از افراد خبره به این دلیل که کلمات پرسوجو دقیقا در اسناد پشتیبان آنها وجود نداشته است، بازیابی نشوند. بنابراین، نیاز به مدل کردن موضوعها و استفاده از آنها در فرآیند خبرهیابی احساس میشود. ما در این پژوهش از فرآیند خبرهیابی مبتنی بر موضوع برای شناسایی خبره استفاده میکنیم. موضوعهای موجود در مجموعهی ACM CCS 2012 به عنوان مجموعه موضوعهایمان در نظر گرفته میشوند، همچنین در راستای این پژوهش برای هر موضوع موجود در این مجموعه یکسری اسناد پشتیبان به منظور توصیف بهتر آن موضوع جمعآوری شده است. در گام بعدی پنج روش انتخاب موضوع برای پرسوجوها پیشنهاد میگردد. روشهای پیشنهادی برای انتخاب موضوع سعی میکنند که با در نظر گرفتن درجهی عمومیت پرسوجو برای هر پرسوجو به شیوهی متفاوتی عمل نمایند. در نهایت نیز برای شناسایی افراد خبرهی متناظر با هر پرسوجو، موضوعهای منتخب را به عنوان یک لایهی پنهان در مدل مبتنی بر سند، مدل مبتنی بر کاندیدا، مدل مبتنی بر سند و گراف ارجاع، و مدل مبتنی بر انجمن وارد میکنیم تا فرآیند شناسایی خبره به کمک این موضوعها صورت بپذیرد. نتایج آزمایشهای انجام شده بر روی مجموعه آزمون جمعآوری شده توسط Deng و مجموعه آزمون استخراج شده از سامانهی جستجوی دانشگاهی مایکروسافت نشان میدهد که روشهای ارایه شده برای شناسایی خبره بر اساس موضوع، میتوانند کیفیت رتبهبندی افراد خبرهی مرتبط با یک پرسجو را بهبود دهند. واژههای کلیدی: خبرهیابی، موضوع، سلسلهمراتبی، جستجوی خبرگی
- Abstract
- With the fast growth of information in different research areas, one cannot expect to be dominant in all fields and cannot catch up with the updates in all areas. People who are able to answer information needs of an area are called experts. Expert finding is the process of recognizing people having sufficient knowledge and expertise in a specific field. Traditional expert finding methods estimate the degree of relation between a query and the supporting document of an expert candidate by calculating the frequency of the query terms in supporting document. This method is incapable of considering semantics, and causes some experts not to be retrieved since their supporting documents do not include the query terms. Therefore modeling topics and using them in expert finding process is required. In this research we use an expert finding process based on topics to find experts. Topics available in ACM CCS 2012 are used as our topics. Moreover a set of supporting documents are collected for each topic. In the next step, five different methods are proposed for finding the topics of queries. The proposed methods try to act differently for each query considering the degree of generality of the query. Finally to find experts related to each query, selected topics are embedded in document-based model, candidate-based model, reference graph and document-based model, community-based model, as a hidden layer. Experiment results on two datasets show that the proposed methods for expert finding based on topics can improve the quality of ranking experts related to a query. Keywords: expert finding, topic, hierarchical, expertise search