عنوان پایان‌نامه

تحلیل خودکار نامه های الکترونیکی برای شخصی سازی جستجو



    دانشجو در تاریخ ۲۰ بهمن ۱۳۸۹ ، به راهنمایی ، پایان نامه با عنوان "تحلیل خودکار نامه های الکترونیکی برای شخصی سازی جستجو" را دفاع نموده است.


    محل دفاع
    کتابخانه دانشکده برق و کامپیوتر شماره ثبت: E1853;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 48325
    تاریخ دفاع
    ۲۰ بهمن ۱۳۸۹
    استاد راهنما
    آزاده شاکری

    در عصر حاضر , بسیاری از موتورهای جستجوی وب به ازای پرس و جوی یکسان , بدون توجه به کاربر و مقصود جستجو , نتایج یکسانی ارائه می دهند. روش های شخصی سازی جستجو قصد دارند تا از اطلاعات کاربر برای بهبود نتایج جستجوی او بهره برند. در حال حاضر , این روش ها از منابع اطلاعاتی متفاوتی به منظور شخصی سازی استفاده می کنند. تاریخچه ی پرس وجو , تاریخچه ی کلیک روی نتایج جستجو و اسناد موجود در رایانه ی شخصی, نمونه هایی ازاین منابع هستند. امروزه, نامه ی الکترونیک به عنوان یکی از ابزارهای ارتباطی پراستفاده , دربرگیرنده ی اطلاعات ارزشمندی درباره ی کاربر می باشد. در این پژوهش , به طور خاص از این منبع اطلاعاتی جهت شخصی سازی جستجو استفاده شده است که روشی بدیع در این حوزه به حساب می آید.بدین منظور, مدلی مارکفی برای مدلسازی کاربر با استفاده از مولفه های اطلاعاتی متنوع نامه های الکترونیک پیشنهاد شده است. در این پژوهش , از برخی مولفه های در دسترس نامه های الکترونیک شامل محتوا, پوشه ها, آدرس پست الکترونیک فرستنده, امضا و تاریخ دریافت برای ساختن مدل کاربر استفاده شده است. استفاده از اطلاعات تاریخ دریافت در مدل, می تواند تغییرات علایق کاربر در طی زمان را ردیابی کند. پس از ساخت مدل کاربر, روشی برای تخمین مدل زبانی آماری پرس وجوی کاربر با استفاده از مدل ساخته شده , ارائه شده است. از این مدل برای جستجو در وب به روش مدل سازی زبانی آماری استفاده می کنیم. برای ارزیابی , آزمایش هایی به قصد پاسخگویی به دو سوال طرح شده اند. یکی یافتن میزان نتایج در مقایسه ی جستجوی ساده و روش شبه بازخورد ارتباطی در شخصی سازی, و دیگری مطالعه ی میزان تاثیر مولفه های اطلاعاتی انتخاب شده از نامه های الکترونیک در انعکاس علایق کاربر. نتایج به دست آمده از مطالعه ی کاربر نشان می دهد که روش پیشنهادی در مدل سازی علایق کاربر و در نتیجه افزایش کارایی جستجو موثر است . روش پیشنهادی از بعد حفاظت از حریم خصوصی نیز مورد بررسی قرار گرفته شد و نتایج بررسی نشان می دهد که سیستم پیشنهادی را می توان به کمک الگوهای معماری استقرار امن برای سیستم های شخصی سازی جستجو, در محیط عملیاتی مستقر نمود. در این پژوهش با ارائه مدل مارکفی, نشان داده شد که اطلاعات نامه های الکترونیک می تواند منبع خوبی برای شخصی سازی جستجو باشند. واژه های کلیدی: شخصی سازی جستجو, ازلاعات نامه های الکترونیک, مدل سازی کاربر
    Abstract
    Today, most of current Web search engines return the same set of results in response to a unique query, irrespective of the user and his search intentions. Personalization methods aim at exploiting user information to improve the search results for each user. Many user-specific information resources are currently being used by these methods. Query history, click history and desktop documents are examples of these resources. Electronic mail is a major communication tool nowadays which contains valuable information about the user. In this research, we use this information resource in personalization which is a novel approach. For this purpose, a Markovian model is designed for user modelling by various email information units. Some accessible units are involved in constructing user model including content, folders, sender email address, signature and date of receipt. we propose a method to model user’s interest using his mailbox which is a novel idea in this area. Using time information in our model can help us track changes in user interests over time. We propose a method to estimate the query language models using user query and constructed user model. Our experimental evaluation is designed to address two questions: “Do the search results have any improvement compared to simple web search and pseudo relevance feedback approach?” and “Are the selected email features are effective in reflecting user interests?”. Experiment results show that our proposed method is effective in improving search accuracy. We also verify our method from privacy protection view and found that, we can deploy our system in operational environments using secure deployment architecture patterns of personalization systems. We conclude that email information is a useful resource for search personalization. Keywords: web search personalization, email information, user modeling.