En el primer artículo relativo al submuestreo de color, nos centramos en explicar la necesidad de esta técnica, ya en los tiempos del vídeo y la TV analógica. Ahora, continuaremos con explicaciones más concretas que suelen caer en el olvido o directamente no explicarse, como el origen del número 4 y cómo se materializa en la práctica la suma de canales de color más pequeños a una imagen más grande.
Por qué se comprime el submuestreo de color en un disco UHD: errores de compresión del cine a casa
4:4:4
Se trata de una señal RGB, no hay submuestreo de color. Cada pixel tiene su valor color en su resolución original. En un entorno HD, 1920×1080 para todos los canales.
4:2:2
Submuestreo del color, Cb y Cr pierde, ½ de resolución horizontal. Por lo tanto Y 1920×1080, Cb y Cr 960×1080 píxeles. Es habitual en los equipos del sector broadcast, como cámaras de estudio.
4:2:0
Submuestreo del color, Cb y Cr pierden ½ de resolución horizontal y vertical. Por lo tanto Y 1920×1080, Cb y Cr 960×540. Es habitual en los equipos de periodismo electrónico europeos o ENG. También es la elección de los discos Bluray UHD.
4:1:1
Submuestreo del color, Cb y Cr pierden ¼ de resolución horizontal pero conservan toda la resolución vertical. Por lo tanto Y 1920×1080, Cb y Cr 1920×270. Es habitual en los equipos de periodismo electrónico americano.
Tanto en 420 como en 411 el ancho de banda resultante es el mismo.
Como dato curioso, el antiguo formato HDCAM con el que se grabaron las primeras películas digitales de Star Wars (La amenaza fantasma usando un HDCAM 900; El ataque de los clones, HDCAM 950; y La venganza de los Sith con un HDCAM 950) tenían un muestreo en 1920×1080 3:1:1, se entrenaron en salas de cine con pantallas gigantescas e independientemente de la calidad de las películas, los albores del cine digital funcionaban para el público mayoritario.
Toda esta teoría hay que aplicarla a la realidad de una imagen o un vídeo. Y como podéis observar en la comparativa de más arriba, la principal sensación que produce al espectador una comparativa entre una misma imagen submuestreada de diferente manera es una progresiva pérdida de definición. Más concretamente, se percibe como una imagen más desenfocada cuanto mayor sea el submuestreo. Adicionalmente, se nota también una pérdida de saturación en los tonos de color y una pequeña reducción del contraste.
Volviendo a la teoría, toda esta anterior percpeción más o menos subjetiva se traduce matemáticamente sin duda alguna si seguimos el siguente ejemplo. Al final podemos expresar la pérdida de ancho de banda de esta otra manera también:
4:2:2 = 4+2+2 = 8 muestras, que es el 66,7% de 4:4:4 (12 muestras posibles)
4:2:0 = 4+2+0 = 6 muestras, que es el 50% de 4:4:4 (12)
4:1:1 = 4+1+1 = 6 muestras, que es el 50% de 4:4:4 (12)
3:1:1 = 3+1+1 = 5 muestras, que es el 42% de 4:4:4 (12)
Por consiguiente, si una señal con el color completo de 4:4:4 tiene un tamaño de 24 MB, significa que una señal de 4:2:2 presentará un tamaño de unos 16 MB, mientras que una de 4:2:0 tendrá 12 MB de tamaño y una señal de 3:1:1 ocupará 10 MB.
Veamos el siguiente ejemplo de un paisaje con jinetes filmado a 1920×1080 y muestreado 422
Reconstruyendo la imagen definitiva, hay que ‘estirar’ a lo ancho al doble de su dimensión el canal azul y rojo para que alcancen la resolución del frame 1920×1080 y, por lo tanto, no todos los pixeles tendrán su información de color exacta y original. En su lugar, los píxeles de los canales Cb/Cr tendrán una información de color de la zona donde estén ubicados aproximada, imprecisa y con mucha menos definición.
Es un ejercicio que se hace muy fácilmente en Photoshop o After Effects o cualquier editor de fotografía. Se pone cada imagen en tres capas distintas y se usa un modo de fusión que las sume para producir la imagen final. Desgracidamente la compresión de las imágenes hace imposible comparar un 442 con un 420 elemento por elemento en la web, pero os animamos a que hagáis el ejercicio en vuestros propios ordenadores con videos o fotos hechas por vosotros mismos y que conozcáis a la perfección.
Errores de compresión
Por último y dado que el submuestreo de croma reduce efectivamente la resolución del color, será más visible cerca de los bordes de las transiciones de color nítidas. Es decir, ¿donde esperamos ver esos errores? en las zonas de imagen que cambian los colores.
En el ejemplo de arriba de los vaqueros en la llanura, resultará evidente que las briznas de hierba seca pierden definción en un entorno 420 frente a un 444. Pero los errores a los que nos referimos, serán evidentes en el recorte de sus figuras (torso, cabeza, sombrero) sobre el cielo azul y la montaña del fondo. El siguiente ejemplo muestra cómo se ve esto con una imagen simple de 8×8 píxeles:
Aunque el submuestreo de croma ha sido una técnica de compresión fácil pero efectiva desde los primeros días del video, puede crear artefactos notables. Las técnicas digitales también se han vuelto mucho más sofisticadas desde entonces.
Mientras que el submuestreo utiliza una simple reducción de la resolución del color en toda la imagen, los códecs digitales modernos pueden analizar el contenido de la imagen y decidir cómo priorizar ese detalle. Las regiones con menor brillo, menos saturación y detalles más toscos pueden tratarse de manera diferente con digital, por ejemplo.
Este detalle es importantísismo: con los codecs de vídeo modernos (ya tratados en este artículo de hace unos días en AVPasión) pueden haber matices significativos a la hora de tratar un mismo submuestreo de color 420 por ejemplo. Y por lo tanto podemos encontrar diferencias de color entre una mismo video en H265 que en VP9.
Los consumidores también se han vuelto más exigentes y esperan más cuando se trata de calidad de imagen. Por lo tanto, ir más allá de la compresión tradicional 4:2:0 utilizada con DVD, Blu-ray y UHD Bluray ha sido una tendencia reciente.
En última instancia, ingestar datos 4:4:4 completos en un códec digital de video moderno aprovecharía al máximo esas imágenes y tiene el potencial de mejorar notablemente la calidad de la imagen. Y como estamos aprendiendo año a año, las limitaciones físicas o de ancho de banda son solo una cuestión de tiempo.
La conclusión sobre el submuestreo de color en los UHD Bluray
¿El uso de submuestreo 4:2:0 degrada significativamente la calidad de imagen para ver películas o series en comparación con el uso de 4:2:2? No según la mayoría de los espectadores que han disfrutado de cualquier cantidad de películas o series en Blu-ray 4K SDR / HDR. No hay una tendencia clara de los usuarios a manifestar que estén insatisfechos por este motivo.
El 4:2:0 es en realidad el nivel de submuestreo de croma requerido por el estándar Blu-ray 4K UHD y gestionada con un codec moderno e increíblemente eficiente de compresión global como el HEVC-h265; por eso da como resultado una más que satisfactoria experiencia en nuestras plataformas de vídeo bajo demanda habituales.
Antes de la reproducción, un reproductor de Blu-ray 4K UHD o ‘media server’ típico verifica la información HDMI EDID almacenada en la pantalla o proyector para determinar si esa pantalla puede manejar directamente video 4:2:2. La mayoría de las pantallas pueden manejar video 4:2:0 o 4:2:2, por lo que el reproductor generalmente aumenta la escala de los datos del disco a 4:2:2 antes de enviarlos a la pantalla, para que la TV lo convierta al final a un RGB 444 para mostrar.
Si la pantalla no es compatible con 4:2:2, el reproductor puede enviar datos 4:2:0 o escalar directamente a 4:4:4 antes de enviar la señal de video a la pantalla.
Dicho esto, la mayoría de los reproductores de Blu-ray 4K UHD y sobre todo los televisores, son capaces de mostrar ficheros de vídeo con una calidad ligeramente superior o con colores más precisos que los que puede obtener de un disco Blu-ray 4K UHD gracias a las posibilidades de los puertos USB 3 que suelen traer.
Todo lo que se necesita es una videocámara 4K y un programa de edición que pueda componer videos de 10 a 12 bits por píxel usando muestreo 4:2:2 , 4:4:4 o mejor aún en RAW. Una vez que estos videos se editan y guardan en un formato como ProRes en Apple o DNxHR en Windows y luego se comprimen con HEVC de 10 bits, se pueden almacenar en una unidad USB 3.0 e insertarlas en el puerto USB del reproductor o del propio televisor.
De hecho, es lo ideal, enchufar el USB directamente al televisor: nos saltamos el reproductor y su cable HDMI. Dado que el reproductor o server no tienen que interpolar de 4:2:0 a 4:2:2 ó 4:4:4, debemos encontrar más detalles en las zonas de imagen más críticas o sensibles si lo hemos hecho bien.
Para terminar este segundo artículo, solo nos quedan lanzar algunas preguntas: ¿cual será el siguiente paso en la distribución de video digital en platafomas o en físico? ¿un nuevo estándar de disco 4:2:2? ¡Ojalá! ¿Os imaginais un escenario con televisores de paneles 12 bits mostrando videos muestreados del original RGB 444 en 4:2:2? Solo el paso de los años nos dirá cuando de acertados o equivocados estamos…