عنوان پایاننامه
اراده یک مدل نرخ - اعوجاج مناسب برای کنترل نرخ در کدگذاری ویدئوی چند نمایی در استاندارد H ۲۶۴/AVC
- رشته تحصیلی
- مهندسی فناوری اطلاعات
- مقطع تحصیلی
- کارشناسی ارشد
- محل دفاع
- کتابخانه مرکزی پردیس 2 فنی شماره ثبت: E 2427;کتابخانه مرکزی -تالار اطلاع رسانی شماره ثبت: 62019
- تاریخ دفاع
- ۲۴ دی ۱۳۹۲
- دانشجو
- زهرا ایروانی
- استاد راهنما
- محمود رضا هاشمی
- چکیده
- در سال های اخیر، تکنولوژی ویدئوی چند نمایی پیشرفت های قابل توجهی کرده و در حوزه هایی مانند بازیهای کامپیوتری و سیستمهای نظارتی مورد توجه قرار گرفته است. ویدئوی چند نمایی با فیلمبرداری از صحنه مورد نظر با دوربین های مختلف و از زوایای مختلف، تجربه متفاوتی را نسبت به ویدئوی تک نمایی در اختیار بیننده قرار میدهد. یکی از چالشهای مهم در این زمینه، کد کردن و ارسال حجم بالای داده های ویدئوی چند نمایی است. به منظور رسیدن به نیازمندیهای نرخ بیت و کیفیت مورد نظر گیرنده های مختلف، الگوریتم کنترل نرخ بیت دارای نقشی حیاتی است. روشهای کنترل نرخ بیت در ویدئوی تک نمایی در استاندارد H.264/AVC به طور گسترده مورد توجه قرار گرفته است. اگرچه الگوریتم های کنترل نرخ ویدئوی چندنمایی بر مبنای الگوریتمهای کنترل نرخ بیت مربوط به ویدئوی تک نمایی هستند، اما مفهوم تخمین عدم تطابق بین نماها که در فشردهسازی ویدئوی چندنمایی مطرح شده است، استراتژی استفاده شده برای کنترل نرخ بیت در ویدئوی تک نمایی و چندنمایی را از یکدیگر متفاوت میسازد. قسمت اصلی الگوریتم کنترل نرخ، پیدا کردن یک مدل کمی است که ارتباط بین مقدار نرخ بیت و میزان اعوجاج نهایی را نشان میدهد. این مدل کمی، مدل نرخ بیت-اعوجاج نامیده میشود. دقت و پیچیدگی محاسباتی این مدل بر اساس پارامترهایی که برای مدل کردن نرخ بیت و اعوجاج استفاده می شود، تعیین می شود. در این پایاننامه، یک روش شناسی مشخص برای انتخاب پارامترهای مناسب برای دستیابی به یک مدل بهبودیافته نرخ بیت – اعوجاج در سطح نما برای ویدئوی چند نمایی ارائه می شود. بدین منظور، ابتدا همه پارامترهای موجود در الگوریتمهای کنترل نرخ پیشنهاد شده قبلی برای ویدئوی تک نمایی و چند نمایی را از روی منابع موجود شامل مقالات کنفرانس ها و مجلات جمعآوری و دستهبندی نموده و سپس میزان تأثیر هر یک از این پارامترها را بر روی نرخ بیت هر نما از ویدئوی چند نمایی بررسی می کنیم. آنگاه پارامترهایی که در کیفیت یکسان بیشترین تأثیر را بر نرخ بیت هر نما دارند، را برای مدل نرخ بیت - اعوجاج انتخاب میکنیم. نتایج شبیهسازی نشان می دهد که پارامترهای انتخاب شده از روش شناسی ارائه شده در این پایاننامه، می تواند به دستیابی به مدل بهبودیافتهای برای نرخ بیت – اعوجاج در سطح نما منجر شود که با پیچیدگی محاسباتی قابل قبول، نرخ بیت هر نما از ویدئوی چندنمایی را با میانگین خطای %12 پیشبینی می نماید.
- Abstract
- Multi-view video technology has made noticeable progress in recent years and has opened its way in entertainment, education, security, and surveillance applications. A multi-view video expands the user’s experience beyond the conventional single view video by showing the same scene captured simultaneously from multiple cameras from different positions and through different angles. One of the major challenges in this field is how to transmit the large amount of data of a multi-view sequence. Rate control is one of the key components of any multi-view video encoder and has a significant impact on its performance in terms of rate-distortion (RD). Rate control usually exploits a RD model to describe the relationship between the rate and the quality of the encoded video. The precision of a RD model is affected by the parameters used in rate-distortion modeling. In this research, an efficient parameter selection scheme for view-level RD models according to the encoding parameters of the H.264/AVC standard has been proposed that can improve the efficiency of view-level RD models in term of prediction precision. At first all the encoding parameters that affect the bitrate of each view according to the H.264/AVC standard are extracted. Then the impact of each parameter in total bitrate of each view is evaluated separately. Finally, a subset of parameters that have a significant impact on the total bitrate of each view are selected. Clearly, considering the specific features of multi-view video coding in addition to the encoder parameters can improve the efficiency of the parameter selection approach. Our proposed approach takes this issue into account. The efficiency of the parameter selection approach is evaluated by using the extracted parameters to refine one of the existing multi-view RD models. Experimental results indicate that by using the extracted parameters from our proposed approach, the rate of each view can be predicted with relatively high precision and a low estimation error of 12% on average. Keywords: Rate control, Rate-Distortion model, Multi-view video coding, Parameter selection scheme.