En este reportaje vamos a poner el Dolby Atmos en la perspectiva adecuada e intentar explicaros, a nivel técnico, por qué no todo el contenido en Atmos suena igual. Hay mucha confusión al respecto de qué esperar en una escucha de una mezcla de sonido inmersiva: desde unas diferencias leves o imperceptibles hasta otras más acentuadas que pueden generar cierta desilusión.
Por eso, vamos a separar tres ámbitos de aplicación donde se emplea el Dolby Atmos:
- Dolby Atmos para salas de cine comerciales
- Dolby Atmos Home en discos físicos (Blu-ray y Blu-ray 4K)
- Dolby Atmos Home en plataformas de streaming de vídeo, música e incluso videojuegos
Cada uno de estos tres ámbitos tiene sus características técnicas distintas y es ahí donde residen las principales diferencias entre las mezclas de sonido: una película con sonido Atmos escuchada en una sala de cine no lleva el mismo Atmos cuando las escuchemos en nuestro domicilio, por ejemplo, viendo Netflix.
Dolby Atmos y su sonido inmersivo
En junio de 2012, la mítica empresa californiana Dolby Laboratories, estrenó la plataforma Dolby Atmos con el largometraje ‘Brave‘ producido por Pixar y dirigido por Mark Andrews y Brenda Chapman. Supuso el estreno del nuevo paradigma del sonido inmersivo, sonido 3D o sonido basado en objetos, que tiene aplicaciones en exhibición de cine en salas, en realidad virtual y también en el entorno de consumo doméstico de contenidos audiovisuales, desde videojuegos a películas.
Este nuevo modelo ya no está basado exclusivamente en el número de canales, que en sonido inmersivo pasan a llamarse ‘beds’ o camas o canales base. Se usan hasta un máximo de 9.1 ó 7.1.2 pero añade un nuevo concepto revolucionario: los llamados ‘objetos’.
Un objeto es, esencialmente, un canal de audio que también contiene información que representa su posición en el espacio con coordenadas X, Y y Z. Esta información posicional, conocida como metadata, acompaña el objeto desde el momento de su creación hasta el momento de su reproducción, por ejemplo viendo una serie en casa o una película en una sala de cine comercial.
Es el eje Z el que brinda la oportunidad de colocar el sonido en cualquier lugar de esa esfera 3D, incluyendo ubicaciones por encima del oyente, mediante la utilización de altavoces colocados en el techo, para crear una experiencia inmersiva que no está presente en los formatos de sonido basados en canales solamente.
Dolby Atmos en salas de cine comerciales
- Formato contenedor: en un disco duro especial se almacena el DCP (Digital Cinema Package)
- Encapsulado: MXF (Material Exchange Format)
- Códec de sonido: WAV (Waveform Audio Format) a 24 bits y hasta 96 Khz
Cuando asistimos a una sala de cine de exhibición comercial y pagamos por ver una película que está mezclada en Dolby Atmos, estamos escuchando la mezcla original, la misma que diseñaron los responsables de la película. Solo sucede en la sala de cine y en ningún sitio más.
Los estudios de sonido certificados por Dolby como «Dolby Atmos Premier» y las mejores salas de exhibición comercial, cuando trabajan el Atmos a 48 Khz pueden llegar a tener hasta un máximo de 64 altavoces independientes para reproducir un total de 128 pistas de sonido simultáneas repartidas en 118 objetos más una ‘bed’ en configuración 9.1.
Si su sesión de trabajo está en 96 Khz (¿escucharemos algún largometraje así algún día?), el número de pistas se reduce a 64 simultáneas, de las que 54 son objetos y una bed en formato 9.1 o 7.1.2 (es decir, 10 canales).
La mezcla de sonido tiene una referencia de volumen de 85 dB siempre y cuando el procesador/amplificador Dolby esté con el regulador de volumen en la posición 7. Permite un rango dinámico de +20 dB, lo que genera un pico máximo de 105 dB.
El canal LFE que reproducen los subwoofers está calibrado a 95 dBC (diez decibelios más altos que el resto de los canales) y sumando esos 20 dB de margen, su pico máximo de sonoridad llega hasta los 115 dB.
La mayoría de las producciones en Atmos para salas de cine llegan en 24 bits y 48 khz, aunque es posible llegar hasta los 96 khz, de sonido sin pérdida de datos, es decir, sonido PCM (Pulse Code Modulation) almacenado en el códec por antonomasia: WAV.
Dolby Atmos Home, en discos físicos
- Formato contenedor: discos ópticos Blu-ray o Blu-ray 4K
- Encapsulado: MLP (Meridian Lossless Packing)
- Códec de sonido: Dolby TrueHD a 24 bits y 48 Khz
En este caso hablamos de ediciones de largometrajes o documentales, videojuegos, conciertos y discos de música, estos últimos normalmente en codificación ‘pure audio’. Si quieres más información sobre estos discos Blu-Ray de calidad audiófila, te dejamos este link con el reportaje que hicimos en su día.
¿Por qué hay un Atmos Home y no nos llega el Atmos del DCP? Hay tres problemas a identificar por los cuales el mix del DCP no se puede reproducir en un entorno doméstico:
- Falta de ancho de banda
- Escasez de espacio de almacenamiento
- Falta de potencia de procesamiento
En lo relativo al primer y segundo problema, el MLP es una técnica de compresión sin pérdida, desarrollada por la empresa Meridian Audio, que elimina la redundancia de las señales de audio PCM. Logra un índice de compresión de aproximadamente 2:1, permitiendo recrear la señal original posteriormente en su reproducción. Dolby TrueHD no es más que el nombre comercial del laboratorio californiano para este MLP.
Como el Dolby TrueHD es, por lo tanto, un códec de audio sin pérdidas, la velocidad de datos es siempre variable. Por ejemplo, las velocidades promedian alrededor de los 4 ó 6 Mbps para un Dolby Atmos a 48 kHz y 24 bits, con un máximo de hasta 18 Mpbs en los modos de 96 Khz. Aunque la base sea un códec PCM igual que el DCP de las salas de cine, el espacio de almacenamiento limitado obliga a usar este códec lossless.
En cuanto al tercer problema, solo hay unas pocas empresas que produzcan equipos más o menos domésticos con una capacidad por encima de la media y que posiblemente, estarían más cerca de reproducir el Atmos de un DCP (es una especulación, obviamente). Estamos hablando de Trinnov o Storm Audio (por cierto, ambas francesas) cuyos receptores AV no dejan de ser ordenadores camuflados y por eso cuestan un dineral, pero son excepciones a la regla. Y previo pago de unos 20.000 € de procesador a los que hay que añadir una amplificador.
Debido a esos tres factores y a algún otro, el Atmos Home necesita añadir dos elementos clave: el Dolby MAT y el Atmos Object Audio Renderer.
Dolby MAT
El codificador Dolby Metadata-enhanced Audio Transmission (Dolby MAT) reside en el reproductor de Blu-Ray y es necesario para acoplar los paquetes de flujos de bits Dolby TrueHD de velocidad variable para transmitirlos a través del protocolo HDMI que usa una velocidad de bits fija entre conexiones.
Posteriormente se emplea un decodificador MAT en el receptor AV para descodificar el Dolby TrueHD. Actualmente este codificador está en su versión 2.0.
Dolby Atmos Object Audio Renderer
Como dijimos antes, tenemos dispositivos que tienen una potencia limitada y por eso se transforma el PCM original del DCP de cines con una codificación espacial limitada en Dolby TrueHD y calculada con metadatos en Dolby MAT 2.0. Este subflujo es una representación eficiente de la mezcla original completa basada en objetos.
Repito, porque es muy importante: es una señal digital codificada espacialmente con una reducción de los metadatos de los objetos. El mix Atmos de una película en DCP puede tener, en películas de género de acción y similares, 30 ó 40 objetos simultáneos que hay que reducir a la mitad en su versión Home. La reducción conserva la metadata para recrear una nueva mezcla cuya representación de la misma coincida razonablemente con la configuración de los altavoces instalados, siendo siempre una aproximación resumida de la mezcla original.
Para reducir el ancho de banda, los objetos y altavoces cercanos se agrupan para formar objetos agregados, que luego se analizan dinámicamente en el proceso que Dolby llama codificación espacial. El sonido de los objetos originales (siguiendo con el ejemplo, 30 ó 40) puede distribuirse entre varios objetos agregados (p.ej sólo 12) para mantener la posición de los elementos originales de una manera fiel aunque no tan precisa. Cuantos menos altavoces tenga nuestro Atmos en casa, más nos alejamos de esa fidelidad, que ya de por sí es aproximada.
Y aquí viene el dato a recordar: Dolby Atmos Home en Blu-ray puede admitir 24.1.10 canales, aunque en la realidad a día de hoy no es así. Tenemos un máximo de 16 canales. ¿Y los objetos? En la práctica, esos objetos agregados en esa codificación espacial hacen que, en el mejor de los casos, tengamos 11, 13 ó 15 objetos simultáneos. Pero pocos largometrajes o discos de música usan esta mezcla dinámica con todos los objetos simultáneos en uso.
Desgraciadamente, la configuración más habitual se reduce a una cama o bed 7.1.4 estática donde no es extraño que, a veces, no haya ni objetos o coincidan exactamente con la posición de los 12 altavoces.
Sólo han pasado doce años desde la invención del Dolby Atmos y cuesta romper con la tradición surround de mezclar con posiciones fijas de canales manejada por ingenieros, técnicos, productores y directores etc para implementar un uso efectivo y optimizado de un sistema nuevo como el inmersivo. Es verdad que parece que, poco a poco, están aumentando las mezclas dinámicas pero es solo una lenta tendencia, quizás algo más acelerada en la industria musical.
Por último, toca hablar de los niveles de referencia: en casa no podemos usar la sonoridad de la mezcla de las salas de cine o nuestros altavoces y nuestros tímpanos volarían por los aires. Lo habitual es llevar a cabo una remezcla o más bien una remasterización en un estudio pequeño con monitores de campo cercano para reducir el rango dinámico, es decir, bajar los picos más sonoros y elevar los volúmenes más bajos. También se suele controlar o limitar el canal LFE por los mismos motivos, así como una redistribución de frecuencias y una reducción del rango dinámico de la mezcla.
Con todo esto, la mezcla de sonido tiene una referencia de unos 75 ó 79 ó 81 dB… no hay un único estándar, desgraciadamente. Se sigue permitiendo 20 dB, lo que permite un buen rango dinámico general. El canal LFE que reproducen los subwoofers está calibrado a 85 dB y sumando esos 20 dB de margen, su pico máximo de sonoridad llega hasta los 105 dB.
Al subwoofer hay que añadirle la gestión de graves o bass management, y eso complica aun más todo esto. Por eso muchos receptores AVR calibran a 75 dB internamente el subwoofer, porque hay que añadir frecuencias y decibelios que vienen del resto de canales.
Dolby Atmos Home, en servicios de streaming
- Formato contenedor: servicios de streaming bajo demanda
- Encapsulado: MPEG 2, MPEG 4, MPEG 5
- Códec de sonido: Dolby Digital Plus, también conocido como Enhanced AC-3 (E-AC-3)
El Dolby Digital Plus, presentado en el año 2004, se entiende mejor en comparación con el vetusto Dolby Digital (AC-3). Este DD+ es esencialmente un Dolby Digital con mayor flexibilidad, funcionalidad de metadatos ampliada y codificación de sonido mejorada (mayor calidad de audio). Su frecuencia de muestreo tiene tres opciones: 32 khz, 44,1 khz y 48 khz. Esta última es la más utilizada con diferencia en el streaming. La profundidad del bit puede ser 16 y 24 bits.
En la teoría, el ancho de banda disponible puede llegar hasta los 1,6 Mbps para el DD+ de los operadores de streaming. Pero en la realidad, los bitrate suelen ser o 384, 448, 640 o 768 kbps, sobre todo estos dos últimos. Si observáis que los datos recibidos son 384 kbps, el número de beds y objetos está limitado a 12 canales y 11 objetos como máximo.
Y aquí viene lo más relevante del DD+: este códec tiene un paquete básico de datos o ‘core’ y una serie de paquetes extra que lo complementan. El extra de datos Atmos es uno de ellos. Y dependerá que el descodificador sea o no compatible para leer estos datos extra.
Dolby Digital Plus JOC
Dolby Digital Plus JOC (Joint Object Coding) se refiere a la tecnología subyacente utilizada para ofrecer Dolby Atmos a través de este formato DD+.
La codificación conjunta de objetos es una técnica de codificación que permite transportar hasta 15 canales u objetos de rango completo de frecuencias, más el canal LFE, dentro de un flujo de bits Dolby Digital Plus de manera compatible con versiones anteriores.
Un decodificador Dolby Digital Plus JOC utiliza los datos de codificación conjunta de objetos para decodificar los canales u objetos a canales de PCM. El decodificador también genera metadatos de audio de objetos (OAMD, objetcs audio metadata) que indican al renderizador Dolby Atmos cómo colocar cada uno de estos objetos y/o canales según el entorno de reproducción configurado.
Es decir, de igual manera que en el TrueHD de discos físicos teníamos los ‘objetos agregados‘, aquí se usan los ‘joint object‘ para reconstruir una mezcla aproximada a la mezcla original. Eso sí, con una metadata bastante menos precisa que la del TrueHD y desde luego que la del DCP. Y, además, con un bitrate tremendamente reducido.
El DD+ es un auténtico prodigio técnico, manteniendo una sorprendente calidad de audio y metadata de hasta 15 canales y objetos simultáneos.
En cuanto a la sonoridad, las mezclas de sonido tienen una referencia de unos 75 dB, aunque no hay un único estándar, desgraciadamente. Netflix, Apple Music y el resto de servicios de streaming usan diferentes normas que oscilan alrededor de esa cifra.
La experiencia de escuchar Atmos en DD+ es sorprendentemente positiva pese a las limitaciones explicadas anteriormente. Solo con un equipo completo de sonido de una calidad decente donde todos los elementos están equilibrados, podemos escuchar esa pérdida de detalles en frecuencias, menos rotundidad y espacialidad reducida típica del DD+ en streaming, comparada con la mezcla original.
Por último, en cuanto a los videojuegos, el Atmos cambia bastante en este sentido. La codificación de objetos pone el límite en un máximo de 32 simultáneos (incluyendo las beds), un número ostensiblemente más alto que con la música y el vídeo. La plataforma inmersiva cambia de escenario y se llama ISF (Intermediate Spatial format) pero ya hablaremos de esto en otra ocasión…