En el mundo del HDR y del Dolby Vision no todo vale, es por ello que necesitaremos tener nuestro televisor o proyector con una configuración lo más fiel posible y especialmente bien configurados para que éste pueda seguir correctamente la curva EOTF que regula el brillo de estos formatos, como iremos viendo a continuación.
En el reportaje anterior en AVPasión, ya os hablamos un poco de lo que es esta curva EOTF (una curva gamma o función de transferencia) y nos quedó en el tintero explicaros cómo captura la luminosidad un sensor de una cámara y luego cómo se transfiere ésta a un visualizador. En éste, será crucial configurarlo adecuadamente. Si alguna palabra de las de aquí se te atraganta, te sugerimos pasar primero por los vídeos de la Academia de AVPasión.
HDR y Dolby Vision: ¿por qué es vital tener una configuración correcta del televisor o proyector?
El cine, el video y la tecnología audiovisual han cambiado drásticamente desde el momento en que se inventaron los televisores CRT. Las cámaras de video todavía tienen sensores que leen la luz de forma lineal, pero esos datos ahora se pueden guardar en una variedad de formatos, como RAW y funciones de datos logarítmicos.
Como resultado, las operaciones de gamma inversas no están necesariamente codificadas en los formatos de salida de las cámaras de video como solían estarlo. Además, los CRT son una reliquia del pasado. Hemos pasado a las tecnologías de pantalla LCD, OLED, proyección digital y láser desde entonces.
Entonces, uno se puede preguntar razonablemente: ¿por qué molestarse con la gamma hoy en día? Si tenemos más control sobre nuestros dispositivos de visualización, ¿por qué no podemos seguir con una función de transferencia de 1.0 para que nuestra entrada sea igual a nuestra salida y no se requieran transformaciones?
Bueno, podríamos, pero hacerlo de una manera que no introdujera «banding» en las sombras requeriría operar a profundidades de bits más allá de lo que los medios de visualización y almacenamiento de consumo son capaces actualmente.
Gamma para mejorar la calidad de la imagen.
Merece la pena recordar un hecho científico clave: nuestros ojos humanos son buenos para detectar cambios en las sombras, pero no son tan buenos para distinguir diferencias sutiles en áreas muy brillantes. Y esta característica es diferente de los sensores de cámara que tienen una respuesta lineal a la luz y priorizan todas las áreas por igual.
En el siguiente gráfico, se muestra cómo se ve una imagen codificada con gamma de 8 bits en comparación con una que se creó con valores de luminancia lineal y luego se transfirió nuevamente a gamma para verla en la pantalla que se encuentra actualmente frente a sus ojos. Este es un buen ejemplo de por qué no usamos valores de luminancia lineal en la transmisión y almacenamiento de materiales entregables.
De los dos degradados, mira atentamente el de abajo y verás que el degradado comienza a mostrar bandas más notorias que el superior. Esto demuestra que la codificación lineal prioriza la precisión de las regiones brillantes más que nuestros ojos humanos, lo que se produce a expensas de que las sombras tengan una menor precisión.
Entonces, dado que la corrección gamma se definió por la respuesta de un CRT a la entrada de energía, surge la pregunta: ¿es la gamma realmente la mejor función de transferencia para las imágenes? Ahora que no estamos limitados por las pantallas CRT, ¿hay otra curva que sirva aún mejor a la visión humana? Con la llegada de las imágenes de alto rango dinámico (HDR) en el horizonte, Dolby investigó un poco al respecto.
Rampa Barten
La ‘Barten Ramp’ tal como hablamos en un artículo anterior de AVPasión, es un gráfico extremadamente útil que traza dónde la mayoría de las personas pueden comenzar a ver bandas en un gradiente al trazar todo el camino hasta 10,000 nits para un posible vídeo HDR. El área en verde muestra dónde no se puede ver banding y el área en rojo muestra dónde se puede aparecer esa posterización y, por lo tanto, es la zona problemática.
Para la calidad de la imagen, preferimos que el vídeo permanezca por debajo del umbral de Barten en todo momento. Sin embargo, como se puede ver en la imagen de arriba, para hacer eso con una función de transferencia gamma estándar, necesitaríamos 15 bits por canal. Si solo asignáramos 10 bits por canal, nuestras regiones más oscuras aún exhibirían defectos de banding.
Además de que 15 bits por canal son un requisito muy alto para los sistemas comerciales o de consumo, también es un uso muy ineficiente de los datos. Hay muchos más datos asignados en las porciones media y brillante de la imagen de lo que se requiere. Una imagen codificada en 13 bits logarítmicos también permanece por debajo del umbral de Barten, pero tiene una codificación ineficiente de las sombras donde se asignan más valores de los necesarios.
Lo que realmente queremos es una curva que se mantenga por debajo del umbral de Barten y siga la curva lo más cerca posible para mantener una eficiencia óptima en la codificación. Es aquí donde se estandariza la norma ST. 2084, también conocida como la función de transferencia «PQ».
PQ EOTF (ST.2084)
La función de transferencia Perceptual Quantization (PQ) fue diseñada específicamente para maximizar la eficiencia de codificación de luminancia para la visión humana, de ahí el nombre. Como se puede ver a continuación, permite que una señal cubra desde 0.001 hasta 10.000 nits sin banding perceptibles utilizando solo 12 bits.
EOTF es un acrónimo que significa ‘función de transferencia electroóptica‘. La gamma también es un EOTF, pero el uso del término realmente ha aumentado desde que las imágenes HDR se desarrollaron para que se vieran en consumos domésticos.
El nombre asusta, cierto, pero no desesperes: todo a lo que realmente se refiere es a la función de transferencia que se usa para convertir unas señales eléctricas a lo que nuestros ojos ven naturalmente, ópticamente; de ahí, electro-óptico. La función inversa ocurre cuando una cámara está grabando una escena, en cuyo caso se denomina OETF (Función de transferencia óptica-electro) ya no es EO sino OE.
Debido a la eficiencia de la PQ en un rango de luminancia tan amplio, se utiliza en los estándares HDR10, HDR10+ y Dolby Vision. Las variedades HDR10 lo utilizan a 10 bits por canal, mientras que Dolby Vision codifica su contenido a 12 bits por canal, lo que le permite permanecer por debajo del umbral de Barten en todo momento.
La PQ es mucho más interesante. Porque todos estaremos pensando que HDR10 y 10+ son estándares erróneos desde su concepción al usar solo 10 bits (ya que se encuentra por encima del umbral de Barten). ¡Pero no! En el mundo real, las características de la imagen como el grano y el ruido rompen el banding (lo disimulan, vaya) e incluso el tipo de codec de vídeo (HEVC, AV1 etc ), por lo que que una señal de 10 bits no es tan problemática como podría parecer.
Recuerda que tampoco se percibe de la misma forma los tonos o colores en un televisor que en otro con distinta tecnología, como es el caso de las QD-OLED por ejemplo.
También debemos mencionar que la BBC (la corporación pública de radiotelevisión británica) desarrolló otro EOTF que funciona de manera diferente a PQ para funciones HDR. La Hybrid Log Gamma (HLG). Utiliza una función de transferencia que combina la codificación gamma tradicional con un sistema de codificación logarítmica para las partes más brillantes de una imagen.
Esto permite que una señal contenga una imagen SDR (rango dinámico estándar) y HDR, lo que permite la compatibilidad con versiones anteriores de los televisores existentes. Como resultado de esta compatibilidad con versiones anteriores, muchos buscan a HLG como el EOTF preferido para transmitir contenido HDR donde hay una combinación de pantallas SDR y HDR. Y es por es que es la elegida para la retransmisiones de eventos en directo por televisión (Eurovisión, JJOO y muchas competiciones deportivas de prestigio etc)
Funciones de transferencia de hoy
Ahora que ya tenemos los conocimientos necesarios, parece el mejor momento para echar un vistazo rápido a las diferentes funciones de transferencia que se emplean hoy en día, ya que varían según el espacio de color y el destino previsto del producto. Cabe señalar que, si bien la lista aquí es lo que se hace comúnmente, es posible forzar los espacios de color para que usen funciones de transferencia alternativas; no necesariamente están vinculados entre sí.
El espacio de color y las funciones de transferencia son operaciones independientes, pero a menudo las imágenes que usan un espacio de color particular también usarán una función de transferencia particular por convención.
EN RESUMEN
Hemos analizado qué es la gamma, por qué existe y cómo afecta a una imagen. Desde sus comienzos necesarios en el caso de las pantallas CRT, la codificación gamma ha tenido un propósito secundario durante décadas. Pero con el desarrollo del vídeo digital, su profundidad de bits asociada es clave para priorizar y codificar los detalles visuales importantes para los humanos.
Con la llegada de las imágenes de alto rango dinámico para la visualización del consumidor, se han creado nuevas funciones de transferencia. La PQ EOTF permite codificar un rango de 0.001-10000 nits sin bandas perceptibles cuando se opera con 12 bits por canal. HLG es una EOTF HDR alternativa que combina codificación gamma y logarítmica y tiene un futuro prometedor en la transmisión HDR de eventos en directo por TV.