عنوان پایان‌نامه

اراده یک مدل نرخ - اعوجاج مناسب برای کنترل نرخ در کدگذاری ویدئوی چند نمایی در استاندارد H ۲۶۴/AVC



    دانشجو در تاریخ ۲۴ دی ۱۳۹۲ ، به راهنمایی ، پایان نامه با عنوان "اراده یک مدل نرخ - اعوجاج مناسب برای کنترل نرخ در کدگذاری ویدئوی چند نمایی در استاندارد H ۲۶۴/AVC" را دفاع نموده است.


    مقطع تحصیلی
    کارشناسی ارشد
    محل دفاع
    کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2427;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 62019
    تاریخ دفاع
    ۲۴ دی ۱۳۹۲
    استاد راهنما
    محمود رضا هاشمی

    در سال های اخیر، تکنولوژی ویدئوی چند نمایی پیشرفت های قابل توجهی کرده و در حوزه هایی مانند بازی‌های کامپیوتری و سیستم‌های نظارتی مورد توجه قرار گرفته است. ویدئوی چند نمایی با فیلمبرداری از صحنه مورد نظر با دوربین های مختلف و از زوایای مختلف، تجربه متفاوتی را نسبت به ویدئوی تک نمایی در اختیار بیننده قرار میدهد. یکی از چالش‌های مهم در این زمینه، کد کردن و ارسال حجم بالای داده های ویدئوی چند نمایی است. به منظور رسیدن به نیازمندی‏های نرخ بیت و کیفیت مورد نظر گیرنده های مختلف، الگوریتم کنترل نرخ بیت دارای نقشی حیاتی است. روش‌های کنترل نرخ بیت در ویدئوی تک نمایی در استاندارد H.264/AVC به طور گسترده مورد توجه قرار گرفته است. اگرچه الگوریتم های کنترل نرخ ویدئوی چندنمایی بر مبنای الگوریتم‌های کنترل نرخ بیت مربوط به ویدئوی تک نمایی هستند، اما مفهوم تخمین عدم تطابق بین نماها که در فشرده‌سازی ویدئوی چندنمایی مطرح شده است، استراتژی استفاده شده برای کنترل نرخ بیت در ویدئوی تک نمایی و چندنمایی را از یکدیگر متفاوت می‌سازد. قسمت اصلی الگوریتم کنترل نرخ، پیدا کردن یک مدل کمی است که ارتباط بین مقدار نرخ بیت و میزان اعوجاج نهایی را نشان می‌دهد. این مدل کمی، مدل نرخ بیت-اعوجاج نامیده می‌شود. دقت و پیچیدگی محاسباتی این مدل بر اساس پارامترهایی که برای مدل کردن نرخ بیت و اعوجاج استفاده می شود، تعیین می شود. در این پایان‌نامه، یک روش شناسی مشخص برای انتخاب پارامترهای مناسب برای دستیابی به یک مدل بهبودیافته نرخ بیت – اعوجاج در سطح نما برای ویدئوی چند نمایی ارائه می شود. بدین منظور، ابتدا همه پارامترهای موجود در الگوریتم‌های کنترل نرخ پیشنهاد شده قبلی برای ویدئوی تک نمایی و چند نمایی را از روی منابع موجود شامل مقالات کنفرانس ها و مجلات جمع‌آوری و دسته‌بندی نموده و سپس میزان تأثیر هر یک از این پارامترها را بر روی نرخ بیت هر نما از ویدئوی چند نمایی بررسی می کنیم. آنگاه پارامترهایی که در کیفیت یکسان بیشترین تأثیر را بر نرخ بیت هر نما دارند، را برای مدل نرخ بیت - اعوجاج انتخاب می‌کنیم. نتایج شبیه‌سازی نشان می دهد که پارامترهای انتخاب شده از روش شناسی ارائه شده در این پایان‌نامه، می تواند به دستیابی به مدل بهبودیافته‌ای برای نرخ بیت – اعوجاج در سطح نما منجر شود که با پیچیدگی محاسباتی قابل قبول، نرخ بیت هر نما از ویدئوی چندنمایی را با میانگین خطای %12 پیش‌بینی می نماید.
    Abstract
    Multi-view video technology has made noticeable progress in recent years and has opened its way in entertainment, education, security, and surveillance applications. A multi-view video expands the user’s experience beyond the conventional single view video by showing the same scene captured simultaneously from multiple cameras from different positions and through different angles. One of the major challenges in this field is how to transmit the large amount of data of a multi-view sequence. Rate control is one of the key components of any multi-view video encoder and has a significant impact on its performance in terms of rate-distortion (RD). Rate control usually exploits a RD model to describe the relationship between the rate and the quality of the encoded video. The precision of a RD model is affected by the parameters used in rate-distortion modeling. In this research, an efficient parameter selection scheme for view-level RD models according to the encoding parameters of the H.264/AVC standard has been proposed that can improve the efficiency of view-level RD models in term of prediction precision. At first all the encoding parameters that affect the bitrate of each view according to the H.264/AVC standard are extracted. Then the impact of each parameter in total bitrate of each view is evaluated separately. Finally, a subset of parameters that have a significant impact on the total bitrate of each view are selected. Clearly, considering the specific features of multi-view video coding in addition to the encoder parameters can improve the efficiency of the parameter selection approach. Our proposed approach takes this issue into account. The efficiency of the parameter selection approach is evaluated by using the extracted parameters to refine one of the existing multi-view RD models. Experimental results indicate that by using the extracted parameters from our proposed approach, the rate of each view can be predicted with relatively high precision and a low estimation error of 12% on average. Keywords: Rate control, Rate-Distortion model, Multi-view video coding, Parameter selection scheme.