Audio y compresión (A3C31A1D09)

Audio y compresión

En el proceso de creación de un contenido audiovisual no cabe duda de que la música, o el audio en general, presenta una relevancia que en la mayoría de las ocasiones supera a la de la propia imagen. El proceso de storytelling, o el arte de cómo contar, desarrollar y adaptar una historia en este formato, requiere el uso de las herramientas de audio para conseguir construir un mensaje robusto que impacte al receptor. La música, los efectos de sonido o la narración, son elementos fundamentales para apelar a las emociones del público. Utilizar estos recursos de manera eficaz, facilitarán que el oyente mantenga la atención en nuestro contenido.

Cuando hablamos de compresión de audio, tenemos que especificar que nos referimos a reducir el tamaño del archivo, reducir la tasa de bits de una señal digital de audio volviéndolo más pequeño, conservando casi toda la información original. En función del grado de compresión la pérdida de calidad podrá ser imperceptible o muy notoria.

Será importante controlar el tamaño del audio, para que ocupe menos espacio en los dispositivos y sea, por tanto, más sencillo de transmitir a menor ancho de banda.

Nota

Prueba a ver un vídeo que te haya impactado, sin audio. Un ejemplo clásico es la escena de la ducha de Psicosis (e.digitall.org.es/psicosis) (Alfred Hitchcock, 1960) con y sin música.

Nota

En el ámbito de la producción musical, cuando se habla de compresión de audio, no se hace referencia a la reducción del tamaño del archivo, sino al procesado que permite controlar el rango dinámico de una señal de audio. En el contexto musical, la dinámica es la diferencia entre las partes fuertes y suaves de una canción. En el contexto del audio, en lugar de partes fuertes y suaves, existen picos individuales y depresiones de la señal. El rango dinámico será alto si hay mucha diferencia entre estos picos y valles y bajo si la diferencia es pequeña. Y estos niveles pueden regularse con el uso de un compresor.

Existen varios tipos de formatos en función de la compresión del audio. Para hablar de ellos, distinguiremos entre formatos de audio sin comprimir y formatos de audio comprimidos (con y sin pérdida).

Formatos de audio sin comprimir

También conocidos como archivos Hi-Res o de alta resolución, son aquellos que preservan toda la información del audio original, procesada y almacenada de manera digital. Estos archivos proporcionan la más alta calidad y fidelidad de audio, ocupando grandes cantidades de espacio de almacenamiento. Entre los más habituales encontramos:

  • WAV (Waveform Audio Format), es el formato sin comprimir más habitual y utilizado, tanto por la industria profesional como a nivel de usuario. Suele contener audio sin comprimir en formato PCM, siendo un formato adecuado para Windows (aunque Mac también lo reproduce).

  • AIFF (Audio Interchange File Format), es otro formato sin compresión de Apple que también se puede reproducir en PC. La mayoría de sus archivos contienen audio sin comprimir en formato PCM.

Nota

El formato PCM es la codificación más utilizada para convertir una onda analógica en una onda digital (secuencia de bits) reproducible en medios digitales.

Formatos de audio comprimido sin pérdidas

Logran comprimir el tamaño de los archivos sin que se pierda calidad general de audio. El nivel de compresión o ahorro de espacio digital no es tan grande como el que nos ofrece la compresión con pérdidas, pero sí que se observa una reducción en comparación con los formatos sin compresión. Los más habituales son:

  • FLAC (Free Lossless Audio Codec), formato de compresión sin pérdida más común en el ámbito musical. Es el código abierto e incluye metadatos incrustados (información del álbum, etc.) Ocupan aproximadamente la mitad del archivo original.

  • ALAC (Apple Lossness Audio Codec), es muy similar a FLAC pero desarrollado por Apple. También es de código abierto, a pesar de ser de Apple.

Formatos de audio comprimido con pérdidas

Estos formatos sacrifican la calidad para minimizar el tamaño. Pesan poco y son reproducibles por cualquier dispositivo, pero generan un sonido pobre y sin brillo. No se utilizan en ámbitos profesionales ya que se pierde la fidelidad del sonido. Entre los más habituales podemos encontrar:

  • MP3 (Moving Picture Experts Group), es el más popular de los formatos con pérdida. Su algoritmo elimina partes o frecuencias que son fácilmente audibles por el oído humano. Su compresión puede realizarse a distintos niveles de kbps (kilo bites por segundo), siendo el de mayor calidad el de 320 kbps.

  • AAC (Advanced Audio Coding), también conocido como MPEG-4. Es el formato comprimido con pérdidas utilizado por iTunes en descargas y por YouTube para gestionar el streaming de su audio.

  • OGG Vorbis, es un formato comprimido con pérdidas de código abierto muy utilizado en plataformas de streaming como Spotify para ahorrar ancho de banda (para que te hagas una idea, la versión gratuita de Spotify reproduce a 128 kbps, mientras que la versión premium lo hace a 320 kbps).

  • WMA (Windows Media Audio), formato creado por Microsoft. Al igual que los dos anteriores, pretende abordar algunos de los fallos del método de compresión del MP3 con un enfoque similar. Aunque en términos objetivos WMA presenta una compresión de más calidad que MP3, es un formato no admitido por muchos dispositivos. Tampoco ofrece ningún beneficio sobre ACC u OGG.

¿Qué formato de audio puede ser el más adecuado?

Esto dependerá de para qué necesitemos nuestro audio. En cualquier caso, si estamos capturando y editando audio sin procesar, la mejor opción será que utilicemos un formato sin comprimir. Así nos aseguraremos estar trabajando con la mejor calidad de audio posible. Al terminar, siempre podremos comprimir (pero esto no podemos hacerlo al revés). Si nos interesa conservar una representación de audio fiel, será conveniente utilizar compresión de audio sin pérdidas. Esta es la razón por la que los melómanos prefieren el formato FLAC por encima del MP3, a pesar de que requiere disponer de más espacio de almacenamiento. Por último, si el archivo no contiene música, es necesario ahorrar espacio y la calidad es un parámetro sacrificable, se puede recurrir a la compresión de audio con pérdida. La realidad es que mayoría de las personas no logra distinguir entre compresión con y sin pérdida. Es extremadamente difícil percibir diferencias, escuchando con equipos o dispositivos de calidad, ya que las compresiones suelen estar al límite de la audición humana. Sin embargo, con equipos de alta gama o auriculares profesionales y con un oído algo educado, se pueden discernir diferencias en matices del audio. Y, desde luego, midiendo con un espectrómetro las longitudes de onda, observaremos diferencias notables.

Compresión de audio

Ejemplo de compresión de audio. Se observa cómo, de izquierda a derecha, en un archivo en MP3, el extremo de frecuencias agudas (medido en Hz) es mayor cuanto menor es el nivel de compresión (mayor cantidad de kbps).