Audio y compresión (A3C31A1D09)

Audio y compresión

En el proceso de creación de un contenido audiovisual no cabe duda de que la música, o el audio en general, presenta una relevancia que en la mayoría de las ocasiones supera a la de la propia imagen. El proceso de storytelling, o el arte de cómo contar, desarrollar y adaptar una historia en este formato, requiere el uso de las herramientas de audio para conseguir construir un mensaje robusto que impacte al receptor. La música, los efectos de sonido o la narración, son elementos fundamentales para apelar a las emociones del público. Utilizar estos recursos de manera eficaz, facilitarán que el oyente mantenga la atención en nuestro contenido.

Cuando hablamos de compresión de audio, tenemos que especificar que nos referimos a reducir el tamaño del archivo, reducir la tasa de bits de una señal digital de audio volviéndolo más pequeño, conservando casi toda la información original. En función del grado de compresión la pérdida de calidad podrá ser imperceptible o muy notoria.

Será importante controlar el tamaño del audio, para que ocupe menos espacio en los dispositivos y sea, por tanto, más sencillo de transmitir a menor ancho de banda.

Nota

Prueba a ver un vídeo que te haya impactado, sin audio. Un ejemplo clásico es la escena de la ducha de Psicosis (e.digitall.org.es/psicosis) (Alfred Hitchcock, 1960) con y sin música.

Nota

En el ámbito de la producción musical, cuando se habla de compresión de audio, no se hace referencia a la reducción del tamaño del archivo, sino al procesado que permite controlar el rango dinámico de una señal de audio. En el contexto musical, la dinámica es la diferencia entre las partes fuertes y suaves de una canción. En el contexto del audio, en lugar de partes fuertes y suaves, existen picos individuales y depresiones de la señal. El rango dinámico será alto si hay mucha diferencia entre estos picos y valles y bajo si la diferencia es pequeña. Y estos niveles pueden regularse con el uso de un compresor.

Existen varios tipos de formatos en función de la compresión del audio. Para hablar de ellos, distinguiremos entre formatos de audio sin comprimir y formatos de audio comprimidos (con y sin pérdida).

Formatos de audio sin comprimir

También conocidos como archivos Hi-Res o de alta resolución, son aquellos que preservan toda la información del audio original, procesada y almacenada de manera digital. Estos archivos proporcionan la más alta calidad y fidelidad de audio, ocupando grandes cantidades de espacio de almacenamiento. Entre los más habituales encontramos:

WAV (Waveform Audio Format), es el formato sin comprimir más habitual y utilizado, tanto por la industria profesional como a nivel de usuario. Suele contener audio sin comprimir en formato PCM, siendo un formato adecuado para Windows (aunque Mac también lo reproduce).
AIFF (Audio Interchange File Format), es otro formato sin compresión de Apple que también se puede reproducir en PC. La mayoría de sus archivos contienen audio sin comprimir en formato PCM.

Nota

El formato PCM es la codificación más utilizada para convertir una onda analógica en una onda digital (secuencia de bits) reproducible en medios digitales.

Formatos de audio comprimido sin pérdidas

Logran comprimir el tamaño de los archivos sin que se pierda calidad general de audio. El nivel de compresión o ahorro de espacio digital no es tan grande como el que nos ofrece la compresión con pérdidas, pero sí que se observa una reducción en comparación con los formatos sin compresión. Los más habituales son:

FLAC (Free Lossless Audio Codec), formato de compresión sin pérdida más común en el ámbito musical. Es el código abierto e incluye metadatos incrustados (información del álbum, etc.) Ocupan aproximadamente la mitad del archivo original.
ALAC (Apple Lossness Audio Codec), es muy similar a FLAC pero desarrollado por Apple. También es de código abierto, a pesar de ser de Apple.

Formatos de audio comprimido con pérdidas

Estos formatos sacrifican la calidad para minimizar el tamaño. Pesan poco y son reproducibles por cualquier dispositivo, pero generan un sonido pobre y sin brillo. No se utilizan en ámbitos profesionales ya que se pierde la fidelidad del sonido. Entre los más habituales podemos encontrar:

MP3 (Moving Picture Experts Group), es el más popular de los formatos con pérdida. Su algoritmo elimina partes o frecuencias que son fácilmente audibles por el oído humano. Su compresión puede realizarse a distintos niveles de kbps (kilo bites por segundo), siendo el de mayor calidad el de 320 kbps.
AAC (Advanced Audio Coding), también conocido como MPEG-4. Es el formato comprimido con pérdidas utilizado por iTunes en descargas y por YouTube para gestionar el streaming de su audio.
OGG Vorbis, es un formato comprimido con pérdidas de código abierto muy utilizado en plataformas de streaming como Spotify para ahorrar ancho de banda (para que te hagas una idea, la versión gratuita de Spotify reproduce a 128 kbps, mientras que la versión premium lo hace a 320 kbps).
WMA (Windows Media Audio), formato creado por Microsoft. Al igual que los dos anteriores, pretende abordar algunos de los fallos del método de compresión del MP3 con un enfoque similar. Aunque en términos objetivos WMA presenta una compresión de más calidad que MP3, es un formato no admitido por muchos dispositivos. Tampoco ofrece ningún beneficio sobre ACC u OGG.

¿Qué formato de audio puede ser el más adecuado?

Esto dependerá de para qué necesitemos nuestro audio. En cualquier caso, si estamos capturando y editando audio sin procesar, la mejor opción será que utilicemos un formato sin comprimir. Así nos aseguraremos estar trabajando con la mejor calidad de audio posible. Al terminar, siempre podremos comprimir (pero esto no podemos hacerlo al revés). Si nos interesa conservar una representación de audio fiel, será conveniente utilizar compresión de audio sin pérdidas. Esta es la razón por la que los melómanos prefieren el formato FLAC por encima del MP3, a pesar de que requiere disponer de más espacio de almacenamiento. Por último, si el archivo no contiene música, es necesario ahorrar espacio y la calidad es un parámetro sacrificable, se puede recurrir a la compresión de audio con pérdida. La realidad es que mayoría de las personas no logra distinguir entre compresión con y sin pérdida. Es extremadamente difícil percibir diferencias, escuchando con equipos o dispositivos de calidad, ya que las compresiones suelen estar al límite de la audición humana. Sin embargo, con equipos de alta gama o auriculares profesionales y con un oído algo educado, se pueden discernir diferencias en matices del audio. Y, desde luego, midiendo con un espectrómetro las longitudes de onda, observaremos diferencias notables.

Ejemplo de compresión de audio. Se observa cómo, de izquierda a derecha, en un archivo en MP3, el extremo de frecuencias agudas (medido en Hz) es mayor cuanto menor es el nivel de compresión (mayor cantidad de kbps).