Hoy toca actualizarnos con el codec xHE-AAC, que es la última tecnología de la familia de códecs ‘Codificación de audio avanzada’ (AAC, con siglas en inglés). Sabemos que el mundo de los códecs siempre está en constante evolución y este xHE-AAC ya está disponible para todos los licenciatarios del grupo de patentes AAC administrado por Via Licensing Alliance, que es quien gestiona y otorga patentes de uso, y es a quien hay que pagar por usarlo.
Este codec, fue desarrollado por MPEG Audio (ISO/IEC SC29/WG6), con importantes contribuciones de Fraunhofer IIS y Dolby, y se incluye en la licencia del paquete de compresores AAC sin coste adicional desde 2018.
xHE-AAC ofrece una calidad de audio mejorada a velocidades de bits estéreo de 12 Kbps a 500 Kbps o más, permite la transmisión adaptativa y proporciona control de volumen y rango dinámico (DRC, dynamic range control). Para los usuarios, esto significa una experiencia de transmisión más satisfactoria por varios motivos: ante un ancho de banda reducido o instantáneo (supongamos que vamos en un tren de alta velocidad, por ejemplo) conmuta ininterrumpidamente a una calidad inferior antes que cortar el audio; y pese a eso, mantiene un volumen constante.
Ya es compatible con Android, iOS y FireOS desde hace muchos años y, desde octubre de 2022, también en Microsoft Windows 11 para PC y Xbox.
Netflix y Meta respaldan xHE-AAC
Netflix comenzó a transmitir xHE-AAC a dispositivos móviles Android compatibles en 2021. En una publicación en el Blog de tecnología de Netflix, (el cual os recomendamos añadirlo a favoritos) Phill Williams y Vijay Gondi describieron el códec como “un deleite sonoro” para los usuarios.
De acuerdo con el estándar de transmisión del gigante norteamericano, Netflix pretende reproducir todos los diálogos al mismo nivel, lo que significa que la gestión del volumen es fundamental. Como dice la publicación del blog: «Cuando funciona de manera efectiva, una vez que configuras el volumen a un nivel cómodo, nunca tendrás que cambiarlo, incluso cuando pasas de una película a un documental o a un concierto en vivo«.
La publicación del blog agrega que el control de rango dinámico (DRC) optimiza «el rango dinámico de un programa para ofrecer la mejor experiencia auditiva en cualquier dispositivo, en cualquier entorno«. Sumado a la gestión del volumen, afirman, puede proporcionar una experiencia auditiva óptima dondequiera que esté el usuario.
En las pruebas, Netflix encontró menos insatisfacción con el nivel de volumen general, menos cambios en los niveles de volumen y un 16% menos de personas que cambiaban a auriculares en lugar de los altavoces integrados de la TV cuando escuchaban contenido con mucha dinámica de sonido usando xHE-AAC.
Meta también ha adoptado xHE-AAC. En una publicación de abril de 2023, el ingeniero de software de audio Zack Cohen describió el códec como “el vehículo para ofrecer audio de alta calidad a escala” y afirmó que ofrece una experiencia de audio superior tanto en Facebook como en Instagram.
Uno de los desafíos que enfrenta Meta es que ofrece diversos tipos de medios, desde contenido breve generado por el usuario, como las famosas ‘Reels‘, hasta videos premium bajo demanda y transmisiones en vivo. «Como resultado de la gestión del volumen de xHE-AAC, las personas pueden pasar más tiempo inmersas en su contenido favorito y menos tiempo solventando problemas con el control de volumen«, escribió Cohen.
También destacó el concepto de fotogramas de reproducción inmediata (IPF) en xHE-AAC, que permiten una velocidad de bits adaptativa (ABR) de audio perfecta. Cambiar entre idiomas p.ej durante la reproducción proporciona audio de alta calidad en cualquier ancho de banda y evita paradas de reproducción, según Cohen: “Después de lanzar audio ABR en Facebook para Android, pudimos mejorar la experiencia del usuario al reducir la cantidad de sesiones en las que la reproducción se detiene. »
La evolución de la AAC
¿Por qué es tan importante xHE-AAC? Para responder a esa pregunta, debemos mirar hacia atrás, al desarrollo de la familia de códecs de audio AAC. Durante las últimas dos décadas o más, la familia de este códec se ha mejorado con continuas evoluciones, cada una de ellas compatible con versiones anteriores y está cubierta por el conjunto de patentes AAC.
Aquellos de vosotros que os dediquéis a la industria audiovisual y/o manejéis programas como Adobe Premiere, AVID, Blackmagic DaVinci etc, a la hora de exportar el contenido os habréis enfrentado a una lista de códecs de sonido inmensa si el destino es alguna plataforma de internet. Todas ‘suenan’ bien pero pocos conocemos los matices que hay detrás de cada sigla.
El códec MPEG-2 AAC original se perfeccionó mediante el proceso de estandarización MPEG-4. Uno de los primeros desarrollos fue AAC de baja complejidad (AAC-LC), publicado en 1999. Con el desarrollo posterior de los servicios de streaming, se volvió omnipresente en dispositivos de todo el mundo.
A AAC-LC le siguió AAC de alta eficiencia (HE-AAC), que incorporó replicación de banda espectral (SBR) para mejorar el audio a velocidades de bits bajas, y luego HE-AAC v2, que agregó un estéreo paramétrico (PS), para codificar de manera eficiente señales estéreo. HE-AAC v2 se adaptaba bien a dispositivos multimedia portátiles y tuvo una amplia aceptación en la industria.
Ahora xHE-AAC ofrece mejoras adicionales que mejoran drásticamente la experiencia de los usuarios al transmitir medios. Estas mejoras incluyen una mejor compresión, una mejor codificación de las señales de voz y MPEG-D DRC (dynamic range congrol), como muestran las anteriores declaraciones de responsables de Meta y Netflix.
El grupo de patentes AAC
En total, estas tecnologías están protegidas por más de 6.000 patentes propiedad de más de una docena de licenciantes, incluidos AT&T, Dolby, Fraunhofer IIS, NTT, Philips y Samsung. De hecho, gracias a la incorporación de nuevas patentes, la cartera de este grupo de fabricantes se ha más que duplicado en los últimos cinco años.
A través del grupo de patentes AAC de Via LA, casi 1.000 empresas tienen licencia para todas estas patentes, incluidas entidades de informática, telecomunicaciones, audiovisuales y de medios de streaming. Se siguen añadiendo nuevos licenciatarios. Por ejemplo, la marca de dispositivos inteligentes OPPO anunció que había obtenido una licencia en febrero de este año 2023 para sus teléfonos móviles.
Por si el lio de siglas os ha sabido a poco, la licencia de patente AAC también cubre AAC-LD (Low Delay), AAC-ELD (Enhanced Low Delay) y AAC-ELD v2. Estos permiten audio de alta calidad para videoconferencias y otras aplicaciones de comunicaciones donde el rendimiento de baja latencia es fundamental.
Nunca apuestes contra la tasa de bits
En cada etapa de la evolución de AAC, la eficiencia de la compresión de audio (es decir, la calidad de audio por bit) ha aumentado. Esto significa que los usuarios experimentan una transmisión más fluida, sin almacenamiento en búfer ni pérdida de calidad, incluso en redes 4G y 5G congestionadas y en mercados emergentes donde las redes 2G/3G aún dominan.
Jan Nordmann, director senior de desarrollo empresarial, nuevos medios de Fraunhofer USA Digital Media Technologies DMT, afirma: “Con el uso de xHE-AAC por parte de Netflix y los servicios de Facebook e Instagram propiedad de Meta, estimamos que más de dos mil millones de horas de xHE-AAC El contenido se transmite cada mes a más de dos mil millones de personas en todo el mundo, y el número no hará más que aumentar. Debido al soporte obligatorio para metadatos de rango dinámico y sonoridad MPEG-D DRC, xHE-AAC proporciona una experiencia de consumidor más consistente en cualquier dispositivo y en cualquier entorno de escucha”.
Christof Fersch, director de estándares e ingeniería de Dolby en Nuremberg, añade: “Incluso cuando aumenta el ancho de banda en las redes, la compresión sigue siendo vital para mantener bajos los costos y entregar contenido de manera fluida, incluso en redes congestionadas. Una codificación de audio más eficiente también significa que se puede mejorar la calidad del vídeo (mucho más difícil de comprimir sin estropear)». La moraleja final sería algo así como que nunca apuestes contra la tasa de bits, siempre mejora con el paso del tiempo.
La demanda de los consumidores de streaming y contenido en vivo está aumentando, especialmente porque los productores de contenido ofrecen medios de mayor calidad, desde películas hasta conciertos, música, audiolibros y podcasts. Por lo tanto, es vital garantizar que los usuarios obtengan una experiencia consistente y de calidad dondequiera que estén y sea cual sea el dispositivo que utilicen, y xHE-AAC lo ofrece. Y la compresión del rango dinámico ha venido para quedarse: cada vez es más necesaria y este xHE AAC la implementa.
—
Fuente: streamingmedia.com