عنوان پایان‌نامه

ارائه یک سیستم شخصی سازی مدیریت محتوا در وب



    دانشجو در تاریخ ۰۲ مهر ۱۳۸۷ ، به راهنمایی ، پایان نامه با عنوان "ارائه یک سیستم شخصی سازی مدیریت محتوا در وب" را دفاع نموده است.


    مقطع تحصیلی
    کارشناسی ارشد
    محل دفاع
    کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 39306
    تاریخ دفاع
    ۰۲ مهر ۱۳۸۷
    استاد راهنما
    فتانه تقی یاره

    چکیده با ظهور شبکه جهانی اینترنت و امکان تولید صفحات شخصی به سهولت و سرعت، میزان اطلاعات وب همواره رو به افزایش بوده است. موتور¬های جستجو که در صورتی که کاربر دقیقا بداند به دنبال چه می¬گردد می¬توانند تا حد زیادی به وی کمک کنند، اما معمولا کاربر از هدف جستجوی خود به صورت دقیق اطلاع ندارد و یا نمی¬تواند منظور خود را به خوبی به موتور جستجو منتقل کند. بیشتر موتور¬های جستجو از محتوای صفحات و پیوندهای میان آنها برای درک مفهوم صفحه استفاده کرده و معمولا پرس¬و-جو محور هستند و برای یک پرس¬و¬جوی یکسان، بدون توجه به کاربر همواره جواب یکسانی ارائه می-دهند. باید یک سامانه شخصی¬سازی مابین فرد و شبکه جهانی قرار گیرد تا خدمات و سرویس های مختلف را برای وی "جفت¬و¬جور" کند. در این پژوهش سه فعالیت اصلی انجام شده است، نخست یک دسته بندی جدید برای تکنیکهای شخصی¬سازی ارائه شده است. در مرحله دوم روش تحلیل زمینه محلی در چندین مرحله برای زبان فارسی با استفاده از سه پارامتر بهینه¬سازی شده است که عبارتند از: تعداد مفهوم¬های استفاده شده برای گسترش پرس¬و¬جو، تعداد اسناد استفاده شده برای بازخورد محلی در بازیابی اولیه و تعداد قطعات متنی که با اطلاعات بازیابی اولیه پر شده و برای کشف و وزن¬دهی مفهوم¬ها استفاده می¬شوند. همچنین روش خطی وزن¬دهی مفهوم¬های اضافه شده به پرس¬و¬جوی گسترش یافته به یک روش هوشمندتر تغییر داده شده است. در مرحله آخر نیز با استفاده از تکنیک تحلیل زمینه محلی بهینه¬شده برای زبان فارسی، روشی هوشمند برای شخصی¬سازی ارائه شده است. برای آزمایش از نگارش سوم کلکسیون شاخص¬گذاری شده همشهری استفاده شده، در تمامی مراحل بهینه¬سازی روش تحلیل زمینه محلی از 60 پرس¬و¬جوی استاندارد استفاده شده تا امکان مقایسه تمامی مراحل با یکدیگر امکان¬پذیر باشد. در مرحله پیاده¬سازی و آزمایش روش شخصی¬سازی نیز از میان 50 پرس و جوی ده داوطلب، 30 پرس¬و¬جوی استاندارد انتخاب شده و سامانه با استفاده از کاربران تولیدکننده پرس¬و¬جوها آزمایش شده است. نتایج نشان می¬دهد که در روش تحلیل زمینه محلی، دو نقطه بهینه¬سازی وجود دارند که به ترتیب بازدهی از 40 و 20 مفهوم استفاده می¬کنند. با استفاده از روش وزن¬دهی جدید نیز، کارایی سامانه نسبت به روش خطی قبلی افزایش پیدا کرده و مفهوم¬های مرتبط¬تر دارای وزن بالاتری در پرس¬و¬جوی گسترش-یافته هستند. در روش وزن¬دهی جدید روش استفاده¬کننده از 20 مفهوم دارای بالاترین میزان کارایی است. در آزمایش سامانه شخصی¬سازی با استفاده از نقاط بهینه¬¬سازی شده نیز، میزان بازدهی سامانه جدید افزایش چشمگیری نسبت به جستجوی شخصی¬سازی نشده نشان می¬دهد.
    Abstract
    Abstract With emerging of the world wide web and fast and easy creation of personal web pages, the volume of data on the web has increased rapidly. Search engines can help the user if he exactly knows what he is looking for, but usually user doesn't know his goal or cannot communicate his purpose to the search engine. Most widely used search engines use only the content of Web documents and their link structures to assess the relevance of the document to the user’s query and no matter who the user of the search engine is, if the same query is provided as input to the search engine, the results returned will be exactly the same. A personalization system must be located between the user and the internet to "tailor" different services and contents for each individual. This thesis contains three major research steps, first a new classification of personalization techniques has been introduced. Then Local Context Analysis has been tuned for farsi language in several steps by tuning three parameters: Number of concepts used for query expansion, number of documents retrieved for local feedback and number of document sections used for concept discovery and weighting. Also, a new concept weighting algorithm has been proposed instead of the original linear method. Finally, using the optimized Local Context Analysis methods for Farsi language, an intelligent method for personalization is proposed. Third version of the Hamshahri collection has been used in the experiments, 60 standard queries have been used in the whole tuning process, so the results in each step are comparable to each other. 30 standard queries have been selected for 50 queries by 10 volunteers to test the proposed personalization method. The experiments lead us to believe that there are two optimization points for the Local Context Analysis method on Farsi language, the systems using 40 and 20 concepts. These points show the best information retrieval performance among other systems. Using the new concept weighting method has increased the information retrieval performance too and related concepts have higher weights in the extended query. In the new concept weighting method, the system using 20 concepts for query expansion shows the best results. In the personalization system experiment, the personalization process using the optimization points from previous steps, show a notable performance over the original retrieval method.