عنوان پایاننامه
بهینه سازی نرخ -اعوجاج با تشخیص ومدل سازی فرآیندهای مستقل در فشرده سازی ویدیو
- رشته تحصیلی
- مهندسی کامپیوتر-معماری کامپیوتر
- مقطع تحصیلی
- دکتری تخصصی PhD
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2836;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 71885
- تاریخ دفاع
- ۲۱ تیر ۱۳۹۴
- دانشجو
- علیرضا امین لو
- استاد راهنما
- سیدامید فاطمی
- چکیده
- برای دسترسی به کیفیت مطلوب در فشردهسازی ویدئو، پارامترهای فشردهسازی مانند حالتهای پیشبینی و بردارهای حرکت باید به طور مناسب در کدکننده ویدئو انتخاب شوند. در عمل و بر اساس یک بستر بهینهسازی موجود، با تقسیم یک ویدئو به زیربخشهای کوچکتر (بلوک)، و در نظر گرفتن شرط استقلال و جمعپذیری برای توابع قید و هدف (نرخبیت و اعوجاج)، عمل بهینهسازی به هر کدام از بلوکها به طور مستقل اعمال میشود تا پارامترهای بهینه با محاسبات کمتر بهدست آید. در این رساله، بستر بهینهسازی موجود گسترش داده میشود، و هر زیربخش (مانند کدکردن بلوک) نیز به چندین زیرجزء مستقل (مانند فرآیند پیشبینی و کدکننده مانده) تقسیم میشود، بهطوریکه نرخبیت و اعوجاج هر زیربخش به ترتیب به صورت حاصلجمع نرخبیت و حاصلضرب توابع زیرجزءها قابل توصیف است. برای این بستر پیشنهادی، توابع هزینه بهینهسازی در هر دو سطح زیربخش و زیرجزء ارائه میشود. بر اساس این نگرش، یک مدل نرخ-اعوجاج دو-تکهای و یک شرط بهینهسازی جدید برای فشردهسازی ویدئو معرفی میشود که بر اساس مقادیر نرخ-اعوجاج مرحله پیشبینی پارامترهای بهینه هر بلوک را بهدست میآورد. تابع هزینه پیشنهادی، در دو روش تخمین حرکت و تعیین مد به کار رفته، و عملکرد آن در دو کاربرد فشردهسازی تک-نرخی و چند-نرخی (تطبیق) ویدئو مورد بررسی قرار میگیرد. بررسیهای انجام شده در این رساله نشان میدهد که پارامترهای بهینه انتخاب شده توسط تابع هزینه پیشنهادی، حساسیت کمتری نسبت به نرخبیت فشردهسازی دارند. بنابراین در کاربرد فشردهسازی چند-نرخی، میتوان پارامترهای بلوکها را برای یک نرخبیت (مثلا بالاترین نرخبیت) با تابع هزینه پیشنهادی بهدست آورد، و از آنها در تولید نسخههای دیگر ویدئو با نرخبیت پایینتر مجددا استفاده کرد. در نتیجه میتوان ویدئوهایی با کیفیت بالاتر و یا نرخبیت کمتر، و با محاسبات کدکننده بسیار کمتر تولید کرد. بر اساس نتایج شبیهسازی، استفاده از تابع هزینه پیشنهادی در دو کاربرد فشردهسازی تک-نرخی و چند-نرخی، به ترتیب باعث کاهش 4.4% و 28.9% نرخبیت ویدئوهای تولید شده میشود. تابع هزینه پیشنهادی وقتی با الگوریتمهای تعیین مد سریع ساده به کار میرود، میزان محاسبات کدکننده را حداکثر 2.4% افزایش میدهد. اما هنگامی که به همراه الگوریتمهای تعیین مد سریع پیشرفتهتر مورد استفاده قرار میگیرد، محاسبات کدکننده را تا 6.8% کاهش میدهد. در نهایت، مقایسهها نشان میدهد که تابع هزینه پیشنهادی بهترین عملکرد فشردهسازی را از لحاظ محاسبات-کیفیت از خود نشان میدهد.
- Abstract
- Optimized selection of coding parameters of blocks, such as prediction modes and motion vectors, significantly improves the quality performance of video compression. In practice, based on an existing optimization framework, a video is divided into several partitions (i.e., blocks) where the additive property are assumed to be valid for both constraint and objective (rate and distortion) functions. The optimization is then independently applied to each block to extract coding parameters with less computational complexity. In this research, the existing optimization framework is extended suchthat each partition (e.g., coding of a block) is further divided into several independent sub-parts (e.g., prediction and residual coding processes). It is assumed that, in this level, bitrate and distortion of each block is calculated by adding and multiplying rates and corresponding distortion functions of sub-parts, respectively. New optimization cost functions are proposed for both levels of optimization. Based on this approach, a two-piece R-D model and a new optimization condition are proposed for video compression, where the optimum parameters of a block is extracted using rate and distortion of prediction steps of that block. The proposed cost function is adopted in motion estimation and mode decision algorithms, and its performance is analyzed in single-rate and multiple-rate (adaptation) video compression applications. Analyses in this research show that the encoding parameters selected by the proposed cost function are less sensitive to the compression bitrate. Hence, in multi-rate video compression application, parameters of blocks can be selected for a specific (e.g., high) bitrate using the proposed cost function. Then, these parameters can be used in the generation of the other bitstreams with lower bitrates. As a result, the proposed method enables generating several compressed bitstreams with lower bitrate and much lower computation. According to the results, using the proposed cost function in both single bitrate and multiple bitrate compression applications reduces the bitrate by about 4.4% and 28.9%, respectively. This is while the additional computational complexity imposed by the proposed cost function does not exceed 2.4%, when it is used with simple fast mode decision algorithms. But, it reduces the encoder complexity up to 6.8% when it is used with more sophisticated fast mode decision algorithms. Finally, results show that the proposed cost function provides the best encoding performance in terms of complexity-quality.