عنوان پایان‌نامه

بهینه سازی نرخ -اعوجاج با تشخیص ومدل سازی فرآیندهای مستقل در فشرده سازی ویدیو



    دانشجو در تاریخ ۲۱ تیر ۱۳۹۴ ، به راهنمایی ، پایان نامه با عنوان "بهینه سازی نرخ -اعوجاج با تشخیص ومدل سازی فرآیندهای مستقل در فشرده سازی ویدیو" را دفاع نموده است.


    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2836;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71885
    تاریخ دفاع
    ۲۱ تیر ۱۳۹۴
    استاد راهنما
    سیدامید فاطمی

    برای دسترسی به کیفیت مطلوب در فشرده‌سازی ویدئو، پارامترهای فشرده‌سازی مانند حالت‌های پیش‌بینی و بردارهای حرکت باید به طور مناسب در کدکننده ویدئو انتخاب شوند. در عمل و بر اساس یک بستر بهینه‌سازی موجود، با تقسیم یک ویدئو به زیربخش‌های کوچک‌تر (بلوک)، و در نظر گرفتن شرط استقلال و جمع‌پذیری برای توابع قید و هدف (نرخ‌بیت و اعوجاج)، عمل بهینه‌سازی به هر کدام از بلوک‌ها به طور مستقل اعمال می‌شود تا پارامترهای بهینه با محاسبات کمتر به‌دست آید. در این رساله، بستر بهینه‌سازی موجود گسترش داده می‌شود، و هر زیربخش (مانند کدکردن بلوک) نیز به چندین زیرجزء مستقل (مانند فرآیند پیش‌بینی و کدکننده مانده) تقسیم می‌شود، به‌طوری‌که نرخ‌بیت و اعوجاج هر زیربخش به ترتیب به صورت حاصل‌جمع نرخ‌بیت و حاصل‌ضرب توابع زیرجزءها قابل توصیف است. برای این بستر پیشنهادی، توابع هزینه بهینه‌سازی در هر دو سطح زیربخش و زیرجزء ارائه می‌شود. بر اساس این نگرش، یک مدل نرخ-اعوجاج دو-تکه‌ای و یک شرط بهینه‌سازی جدید برای فشرده‌سازی ویدئو معرفی می‌شود که بر اساس مقادیر نرخ-اعوجاج مرحله پیش‌بینی پارامترهای بهینه هر بلوک را به‌دست می‌آورد. تابع هزینه پیشنهادی، در دو روش تخمین حرکت و تعیین مد به کار رفته، و عملکرد آن در دو کاربرد فشرده‌سازی تک-نرخی و چند-نرخی (تطبیق) ویدئو مورد بررسی قرار می‌گیرد. بررسی‌های انجام شده در این رساله نشان می‌دهد که پارامترهای بهینه انتخاب شده توسط تابع هزینه پیشنهادی، حساسیت کمتری نسبت به نرخ‌بیت فشرده‌سازی دارند. بنابراین در کاربرد فشرده‌سازی چند-نرخی، می‌توان پارامترهای بلوک‌ها را برای یک نرخ‌بیت (مثلا بالاترین نرخ‌بیت) با تابع هزینه پیشنهادی به‌دست آورد، و از آن‌ها در تولید نسخه‌های دیگر ویدئو با نرخ‌بیت پایین‌تر مجددا استفاده کرد. در نتیجه می‌توان ویدئوهایی با کیفیت بالاتر و یا نرخ‌بیت کمتر، و با محاسبات کدکننده بسیار کمتر تولید کرد. بر اساس نتایج شبیه‌سازی، استفاده از تابع هزینه پیشنهادی در دو کاربرد فشرده‌سازی تک-نرخی و چند-نرخی، به ترتیب باعث کاهش 4.4% و 28.9% نرخ‌بیت ویدئوهای تولید شده می‌شود. تابع هزینه پیشنهادی وقتی با الگوریتم‌های تعیین مد سریع ساده به کار می‌رود، میزان محاسبات کدکننده را حداکثر 2.4% افزایش می‌دهد. اما هنگامی که به همراه الگوریتم‌های تعیین مد سریع پیشرفته‌تر مورد استفاده قرار می‌گیرد، محاسبات کدکننده را تا 6.8% کاهش می‌دهد. در نهایت، مقایسه‌ها نشان می‌دهد که تابع هزینه پیشنهادی بهترین عملکرد فشرده‌سازی را از لحاظ محاسبات-کیفیت از خود نشان می‌دهد.
    Abstract
    Optimized selection of coding parameters of blocks, such as prediction modes and motion vectors, significantly improves the quality performance of video compression. In practice, based on an existing optimization framework, a video is divided into several partitions (i.e., blocks) where the additive property are assumed to be valid for both constraint and objective (rate and distortion) functions. The optimization is then independently applied to each block to extract coding parameters with less computational complexity. In this research, the existing optimization framework is extended suchthat each partition (e.g., coding of a block) is further divided into several independent sub-parts (e.g., prediction and residual coding processes). It is assumed that, in this level, bitrate and distortion of each block is calculated by adding and multiplying rates and corresponding distortion functions of sub-parts, respectively. New optimization cost functions are proposed for both levels of optimization. Based on this approach, a two-piece R-D model and a new optimization condition are proposed for video compression, where the optimum parameters of a block is extracted using rate and distortion of prediction steps of that block. The proposed cost function is adopted in motion estimation and mode decision algorithms, and its performance is analyzed in single-rate and multiple-rate (adaptation) video compression applications. Analyses in this research show that the encoding parameters selected by the proposed cost function are less sensitive to the compression bitrate. Hence, in multi-rate video compression application, parameters of blocks can be selected for a specific (e.g., high) bitrate using the proposed cost function. Then, these parameters can be used in the generation of the other bitstreams with lower bitrates. As a result, the proposed method enables generating several compressed bitstreams with lower bitrate and much lower computation. According to the results, using the proposed cost function in both single bitrate and multiple bitrate compression applications reduces the bitrate by about 4.4% and 28.9%, respectively. This is while the additional computational complexity imposed by the proposed cost function does not exceed 2.4%, when it is used with simple fast mode decision algorithms. But, it reduces the encoder complexity up to 6.8% when it is used with more sophisticated fast mode decision algorithms. Finally, results show that the proposed cost function provides the best encoding performance in terms of complexity-quality.