Vamos a dedicar dos entregas a explicar detalladamente el concepto del submuestreo de color en el video digital. Seguramente sea uno de los conceptos más abstractos para el aficionado medio por su gran carga matemática. En este primer artículo, vamos a aproximarnos a la necesidad que lleva a elegir esta pérdida de información y cómo se lleva a cabo.
Muchos de estos conceptos salen en artículos previos, como por ejemplo en el de cómo caibrar tu televisor en 5 sencillos pasos, así que esperamos que os ayude a entender mejor las tecnologías y funcionamiento interno a la hora de hablar de calidad de imagen y vídeo digital.
Como se codifica el color en el video digital: la importancia del submuestreo de color
Por lo general, se piensa que la compresión de video es exclusiva de lo digital, pero también ha existido desde los primeros días del video analógico. La compresión se ha vuelto más sofisticada desde entonces, evidentemente. En este artículo, echaremos un vistazo a una de las primeras estrategias en particular: submuestreo de croma 4:2:2, 4:1:1 y 4:2:0.
Esto se convirtió en una motivación central detrás de las primeras formas de compresión analógica y digital. Las señales de video se separarían en un componente de luminosidad o «luma» y dos componentes de color o «croma» (resumido de crominancia), de manera similar a cómo las imágenes se pueden separar en tres componentes rojo, verde y azul (RGB).
Los componentes de luminancia y croma se denominarían YUV (en el mundo analógico) o YCbCr (en el ámbito digital) en lugar de RGB. De esta manera, nació el video por componentes o más concretamente el video por componentes diferencia de color.
Una vez separada, la resolución espacial, es decir, el tamaño medido en píxeles (1024×576, 1280×720 etc), de la crominancia se reduciría a la mitad o más a través de un proceso llamado «submuestreo de croma«. El resultado final es una señal de video que aparentemente tiene una calidad suficiente en el mismo ancho de banda de transmisión, ya que el componente luma ocupa una fracción mayor de la señal de video:
La técnica también es relativamente simple de implementar y no requiere procesadores rápidos para decodificar. Por estas razones, la estrategia ha tenido un gran éxito y persiste hasta el día de hoy.
Los primeros monitores mostraban imágenes escaneando progresivamente cada línea horizontal de píxeles, generalmente de arriba a abajo en rápida sucesión. A medida que se escanea cada línea, los valores se analizan con menos frecuencia para el croma que para el luma.
Aunque no todos los dispositivos de visualización modernos funcionan de esta manera, el concepto de líneas de exploración sigue siendo importante porque los tipos de submuestreo cromático se especifican horizontalmente. Cada tipo se enumera a menudo como una relación entre la velocidad a la que se envían los valores de luma y croma a medida que se escanea una línea.
Esta proporción generalmente se basa en cuatro valores de luminancia y toma la forma 4:X:Y, donde X e Y son el número relativo de valores de croma en filas de un bloque o matriz de 4×2 píxeles. El siguiente ejemplo ilustra cómo estas proporciones afectan la resolución de una imagen simple de 4×2 píxeles:
Usando la nomenclatura estándar, 4:2:2 significa que cada línea de exploración horizontal tiene 2 valores de croma por cada 4 valores de luminancia. De manera similar, 4:1:1 significa que se envía 1 valor de croma por cada 4 valores de luma enviados, y 4:4:4 significa que no hay submuestreo de croma.
Sin embargo, esto no es del todo consistente. 4:2:0 implicaría que por cada 4 valores de luminancia, habría 2 para el primer componente cromático y 0 para el segundo, pero esto no produciría imágenes a todo color. En la práctica, 4: 2: 0 significa que hay dos de cada muestra de croma por línea de exploración, pero que solo están presentes cada dos líneas.
Decíamos, que para referirnos a este proceso se emplea una nomenclatura de tres cifras, por ejemplo 4:2:2 o 4:1:1. En la industria, se entiende que una señal RGB tiene un muestreo de color 4:4:4, y una señal en vídeo por componentes YCbCr tiene un submuestreo (y, por lo tanto, pierde calidad) 4:2:2 o inferior. Ese ha sido su objetivo tanto en la época analógica como digital: reducir la información y por lo tanto el ancho de banda.
Usando esta nomenclatura, el primer dígito se refiere a la luminancia (Y), el segundo a la información de color azul (Cb) y el tercer dígito al color rojo (Cr); donde el 4 expresa la presencia del 100% de la información, el 2 el 50%, el 1 un 25%. Como decíamos un poco más arriba, con el 0 no implica que no haya información de color rojo nunca, sino que es idéntico al dígito anterior submuestreado verticalmente; o dicho en otras palabras: de entre todos los pixeles, habrá algunos que no tendrán su propia y exacta información de color rojo.
Matemáticamente Cb equivale a B-Y (azul menos luminancia) y Cr equivale a R-Y (rojo menos luminancia)
¿Y por qué se usa el numero 4 como referencia y no cualquier otro? El número 4 se explica porque originalmente en la antigua TV analógica la frecuencia de muestro de Y era casi cuatro veces la del color y para simplificar cálculos se optó por el numero entero más cercano.
De forma más concreta, la SMPTE americana eligió 14,32Mhz como la frecuencia de muestreo de Y; resultante de multiplicar 4 veces la antigua frecuencia portadora de la información de color 3,58 MHz. Así pues, el uso de la magnitud ‘4’ en la nomenclatura del muestreo del color, es pura nostalgia de los orígenes de la TV analógica.
En los antiguos días de la TV analógica en color, los canales U y V (señales de crominancia) tuvieron que ser reducidos mediante un circuito eléctrico lowpass filter para acomodar esta nueva señal en el mismo ancho de banda que la TV en blanco y negro.
Pero en la era digital actual, los canales Cb y Cr son reducidos en resolución espacial. Y de nuevo la pregunta: ¿todo esto por qué? Para reducir la tasa de transferencia de fichero de video o el ancho de banda necesario para el códec empleado en una transmisión, por ejemplo, de televisión digital terrestre (TDT).