وقتی صحبت از تولید ویدئوی دیجیتال به میان می آید، اغلب شاهد ارائه مشخصات پردازش تصویر 8 بیتی، 10 بیتی یا حتی 12 بیتی هستیم. گاهی اوقات اعدادی مانند 4:4:4، 4:2:2 و 4:2:0 را نیز در دستگاه های ضبط پیدا می کنید. این اعداد دقیقاً به چه معنا هستند و چگونه بر کیفیت تصویر و رنگ ها تأثیر می گذارند؟ ما در این مقاله به تمام سوالات شما پاسخ خواهیم داد.
عمق رنگ که به عنوان عمق بیت ( bit-depth) نیز شناخته می شود، به تعداد بیت های مورد استفاده برای تعریف کانال های رنگ قرمز، سبز یا آبی برای هر پیکسل اشاره دارد.
در اکثر سیستم های RGB، 256 سایه در هر کانال رنگ وجود دارد. اگر سیستم باینری را به اندازه کافی بشناسید، این عدد 256 باید برای شما بسیار آشنا به نظر برسد. عدد، 256، 2 به توان 8 یا عمق رنگ 8 بیتی است. این بدان معنی است که هر یک از کانال های RGB دارای 256 سایه هستند، بنابراین در این سیستم 8 بیتی RGB، 256x256x256 یا 16777216 رنگ در کل وجود دارد.
یک سیستم رنگی 8 بیتی قادر به تولید بیش از 16 میلیون رنگ است. این ممکن است بسیار زیاد به نظر برسد، اما در مقایسه با 10 بیت، در واقع هیچ چیز نیست. در یک سیستم 10 بیتی، می توانید 1024 x 1024 x 1024 = 1,073,741,824 رنگ تولید کنید که 64 برابر رنگ های 8 بیتی است. آنچه تکان دهنده تر است این است که یک سیستم 12 بیتی قادر به تولید 4096 x 4096 x 4096 = 68,719,476,736 رنگ است! در نتیجه افزایش عمق رنگ به شما امکان می دهد رنگ های خود را بهتر نشان دهید.
ما اغلب اعداد 4:4:4، 4:2:2 و 4:2:0 را در دستگاههای ضبط میبینیم که به عنوان زیر نمونهبرداری کروما (chroma subsampling) شناخته میشوند. آیا تا به حال به این فکر کرده اید که چگونه نمونه برداری رنگی بر رنگ های تصویر تأثیر می گذارد؟ و این اعداد 4:4:4، 4:2:2 و 4:2:0 دقیقا به چه معنا هستند؟
قبل از اینکه به زیر نمونه برداری رنگی بپردازیم، اجازه دهید ابتدا در مورد پیکسل تصویر صحبت کنیم. پیکسل تصویر با اجزای luma و chrominance تعریف می شود. بدون اجزای کرومینانس، لومای هر پیکسل، نمایی خاکستری از تصویر ایجاد می کند. همچنین، مطالعه نشان می دهد که چشم انسان به نور یا درخشندگی حساس تر است تا به رنگ.
YCbCr خانواده ای از فضاهای رنگی است که به عنوان بخشی از تصویر رنگی در سیستم های فیلمبرداری و عکاسی دیجیتال استفاده می شود. Y به روشنایی پیکسل اشاره دارد و 1/3 مقدار سیگنال را به اشتراک می گذارد. سیگنال روشنایی همیشه بدون فشرده سازی حفظ می شود. Cb و Cr دو سیگنال کروما هستند که 2/3 مقدار سیگنال را به اشتراک می گذارند. سیگنالهای کروما را میتوان برای صرفهجویی در مقدار بارگذاری داده فشرده کرد.
برای مثال 4:4:4 را در نظر می گیریم:
4 مورد اول نشان دهنده تعداد پیکسل هایی است که نمونه برداری می کنیم. 4 دوم به معنای بازده 4 رنگ در ردیف اول نمونه برداری رنگی است و 4 سوم، مجدداً به معنای بازده 4 رنگ در ردیف دوم نمونه برداری رنگی است. از نظر فنی، 4:4:4 نشان میدهد که هر پیکسل مقدار رنگ خاص خود را دارد که شامل تمام اطلاعات کروم است، بنابراین نمونهبرداری فرعی کروم نیست. حالا بیایید نگاهی به 4:2:2 بیندازیم.
2 دوم به معنای دو نمونه رنگی فرعی در ردیف اول است. و 2 سوم به معنای دو نمونه رنگی فرعی در ردیف دوم است. بنابراین، یک تصویر 4:2:2 فقط نیمی از نمونههای رنگی را که یک تصویر 4:4:4 حفظ میکند، حفظ میکند.
در مورد 4:2:0، نشاندهنده دو نمونهبرداری فرعی رنگی در ردیف اول و عدم وجود نمونهبرداری فرعی کروم در ردیف دوم است، بنابراین پیکسلهای ردیف دوم همان مقدار کروم ردیف اول را کپی میکنند. در نتیجه، یک تصویر 4:2:0 تنها یک چهارم رنگ فرعی را که یک تصویر 4:4:4 انجام می دهد، حفظ می کند.
پیکسلها نقاط رنگی بسیار ریز هستند، بنابراین تشخیص تفاوت بصری قابلتوجه این که آیا ویدیو در 4:4:4، 4:2:2 یا 4:2:0 ضبط شده است بسیار دشوار است. با این حال، 4:4:4 قادر است اطلاعات رنگ بیشتری را نسبت به 4:2:2 و 4:2:0 ثبت کند، بنابراین مدل فرعی کروما 4:4:4 هنوز نسبت به 4:2:0 و 4:2:2 از نظر کیفیت رنگ برتری دارد.
اکثر دوربینهای DSLR و mirrorless موجود در بازار از مدل فرعی کروما 4:2:0 برای فشردهسازی فایلهای ویدیویی استفاده میکنند. حتی اگر میتوانید کیفیت تصویر خوبی را از ویدیوی ۴:۲:۰ به دست آورید، ممکن است به دلیل وضوح پایین برای اطلاعات کروم، هنگام انجام کروماکی یا پس از ویرایش با مشکلاتی مواجه شوید. در مقایسه با تصاویر 4:4:4، دستیابی به یک نتیجه کروماکی تمیز با ویدئوهای 4:2:0 دشوارتر و زمان برتر خواهد بود. به همین دلیل است که تولیدکنندگان حرفهای ویدیو همچنان ترجیح میدهند با ویدیوهای 4:4:4 یا 4:2:2 کار کنند، که حاوی اطلاعات کرومای بیشتری است که ویرایشهای پس از آن را تسهیل میکند، تنها ویدیوی نهایی در 4:2:0 برای صرفهجویی در اندازه فشرده میشود.
این روش تولید مانند این است که یک عکاس حرفه ای همیشه با فایل های RAW عکس می گیرد و سپس تصاویر ویرایش شده را در فرمت JPG برای برنامه های بعدی خروجی می گیرد.
با دانستن تئوری نمونهبرداری رنگی، مخاطب باید بداند که چرا فقط تجهیزات ویدئویی سطح برودکست حرفهای قادر به ارائه تصویری بسیار با کیفیت هستند و چرا از دوربینهای دیجیتال و تلفنهای همراه گران تر هستند. بیایید دوربین فیلمبرداری با لنز قابل تعویض Datavideo BC-100 را مثال بزنیم. BC-100 یک دوربین فیلمبرداری حرفه ایست که برای استودیو مجازی طراحی شده است. این دوربین مجهز به سنسور پردازش تصویر 12 بیتی است که میتواند حجم عظیمی از اطلاعات رنگی را ثبت کند و بهترین تفاوتهای رنگی را ارائه دهد. رنگهای غنی و کیفیت تصویر واضح نه تنها برای لذت بصری بلکه ویژگیهای ضروری برای دستیابی به اشیاء تمیز و خالص از پسزمینه با استفاده از chromakeying هستند.
با استفاده از تکنیک پیشرفته، می توانید به راحتی اشیاء چالش برانگیز مانند لیوان یا مو را با کلیدهای رنگی، بهترین جزئیات را همراه با پس زمینه مجازی ارائه دهید. علاوه بر این، تکنیک محدوده دینامیکی بالا (HDR) به دوربین فیلمبرداری اجازه می دهد تا جزئیات قسمت های روشن و تاریک تصویر را در شرایط کنتراست بالا ضبط کند و تصاویر را با چشم انسان واقعی تر کند.
ترجمه : تیم ترجمه یریآل