Wednesday, October 25, 2006

Compresión de audio digital

Compresión de audio digital
Como hemos visto anteriormente, cada muestra tomada es almacenada en el ordenador ocupando uno o dos bytes de memoria dependiendo de si se ha tomado una resolución de 8 o 16 bits. Esto conlleva emplear grandes espacios de disco para almacenar estos ficheros de sonido. Se han desarrollado muchos formatos de archivos comprimidos que permiten realizar grabaciones de alta calidad sin necesidad de utilizar tanto espacio de disco. Estas técnicas suelen incluir un método para codificar secuencias largas de bytes repetidos. Evidentemente existe una contrapartida y es que una vez comprimido el archivo de sonido, este no puede ser editado para su modificación.

Formatos de archivos de sonido
Archivos AU.- Son el formato audio estandar en ordenadores Sun. Por lo general son de 8 bits y poseen menor calidad que otros formatos de sonido.
IFF.- Es común en ordenadores Mac. Pueden ser de 8 o 16 bits, soportan frecuencias de muestreo de hasta 44,1 kHz y por lo general tienen una buena calidad de sonido. IFF-C es un formato de archivo IFF comprimido.
Audio WAV.- Es el formato propio de Windows. Pueden ser de 8 o 16 bits con indices de muestreo de 11,025 kHz, 22,05 kHz o 44,1 kHz y por lo general tienen buena calidad de sonido.
VOC.- Similares a los archivos WAV con la salvedad de que los VOC incluyen unos marcadores de sincronización que los programas de presentación multimedia pueden utilizar para sincronizar la reproducción de archivos VOC con imágenes o videos u otros sonidos.
RA.- Real Audio. Es un formato utilizado para reproducir sonidos en Internet, y ofrece unas caracteristicas especiales que lo hacen muy interesante en este campo. Si utilizaramos archivos del tipo *.wav, podemos imaginarnos el tiempo necesario que haría falta para acceder a un archivo cuya capacidad puede llegar a ser de varios megas. Real Audio permite trabajar con ficheros comprimidos en tiempo real descomprimiendo el archivo a la vez que lo reproduce, evidentemente la calidad del sonido no será igual que la obtenida de un CD, pero sirve perfectamente a sus fines.

COMPROMISOS EN EL MUESTREO

COMPROMISOS EN EL MUESTREO Se podría asumir que todo lo que hay que hacer para obtener buen sonido es grabar a la velocidad límite de 44,1 kHz con muestras de 16 bits (2 bytes). El único problema que aparece si se graba en estéreo, tomando muestras simultáneamente en los canales izquierdo y derecho a 44,1 kHz, una muestra de sonido de un minuto necesita un espacio para almacenarse de 10,58MB.

Lo aconsejable es usar la frecuencia de muestreo más baja posible. Por ejemplo, supongamos que planeamos grabar una conversación telefónica. El ancho de banda de un teléfono es de sólo 3 kHz. De acuerdo con el teorema de Nyquist, la grabación será acertada si la frecuencia de muestreo es de 6 kHz o mayor.

Cuando se elige la frecuencia de muestreo, también hay que considerar el ancho de banda de todo el sistema. Por ejemplo, no existe ningún problema en la grabación de audio digital a 44,1 kHz si el micrófono utilizado funciona a 12 kHz y la fuente de sonido es una voz masculina grave que no supera los 7 kHz.

Velocidad y tamaño de muestra

Velocidad y tamaño de muestra

La fidelidad terminología empleada por los entusiastas del audio para expresar la exactitud en la réplica de la música original del sonido audio digital depende de la selección de la correcta frecuencia de muestreo y del correcto tamaño de muestra, siendo este último el número de bytes utilizados para almacenar cada muestra.

FRECUENCIA DE MUESTRA: La frecuencia de muestra (también denominada frecuencia de muestreo) debe ser lo suficientemente alta para que los sonidos de alta frecuencia, como el sonido del cristal de una copa de vino o el del arqueo de un violín, puedan recogerse con precisión. Según el teorema de Nyquist, es posible repetir con exactitud una forma de onda si la frecuencia de muestreo es como mínimo el doble de la frecuencia de la componente de mayor frecuencia. La frecuencia más alta que puede percibir el oído humano está cercana a los 20 kHz, de modo que la frecuencia de muestreo de 44.1 kHz de las tarjetas de sonido es más que suficiente. Este valor es el utilizado hoy en día por los reproductores de audio CD.

Los archivos de audio digital pueden grabarse seleccionando la frecuencia de muestreo. A medida que aumenta la frecuencia de muestreo, aumenta la calidad del sonido. Por ejemplo, una velocidad de 6.000 Hz (6.000 muestras por segundo) es buena para una voz masculina típica, pero no lo es para una voz femenina típica, que tiene componentes con una frecuencia más alta. Una frecuencia de muestreo de 8.000 Hz proporciona una grabación de la voz femenina de mayor calidad.

Grabación y reproducción de audio

Grabación y reproducción de audio: Bases del audio digitalAntes de que la computadora pueda grabar, manipular y reproducir sonido, debe transformarse el sonido de una forma analógica audible a una forma digital aceptable por la computadora, mediante un proceso denominado conversión analógica - digital (ADC). Una vez que los datos de sonido se han almacenado como bytes en la computadora, puede hacerse uso de la potencia de la CPU de la computadora para transformar este sonido de miles de modos. Con el software adecuado es posible, por ejemplo, añadir reverberación o eco a la música o a la voz. Pueden eliminarse trozos de sonido grabado. Pueden mezclarse archivos de sonido, ajustarse el tono de la voz de manera que no pueda reconocerse y muchas cosas más. Finalmente, cuando se está dispuesto a escuchar el resultado, el proceso de conversión digital-analógica (DAC) transforma de nuevo los bytes de sonido a una señal eléctrica analógica que emiten los altavoces.

Muestreo: Conversión analógica-digital y viceversa
Comenzaremos con la captura del sonido haciendo uso del micrófono. Cuando las ondas de sonido llegan al micrófono, el movimiento mecánico se traduce en una señal eléctrica. Esta señal se denomina señal analógica porque es una señal continua en el tiempo, análoga al sonido original.
CONVERSION ANALOGICA-DIGITAL (ADC): Dada una señal analógica, se van tomando valores discretos de su amplitud a intervalos de tiempo pequeños, evidentemente será más fiable la reproducción cuantas más muestras por segundo se tomen. A estos valores obtenidos se les asigna un valor digital que el computador puede entender y procesar como se requiera.
A cada muestra obtenida se le asigna un equivalente binario ya que es en este sistema en el que trabajan los computadores, su unidad de información es el bit. Un bit solo puede tomar dos posibles valores "1" o "0", es lógico pensar que será necesario ampliar esta unidad de información para así poder asignar a cada valor de muestra tomada un equivalente binario. Por esta razón y dependiendo de la fidelidad con que queramos trabajar podemos utilizar palabras de 8 o 16 bits pudiendo obtener así 256 ó 65536 combinaciones distintas y obtener mayor resolución.

CONVERSION DIGITAL-ANALOGICA (DAC): El proceso inverso es mucho menos complejo ya que solo se trata de ir poniendo los valores de las muestras en el mismo orden que fueron tomados y unos filtros eléctronicos se encargan de convertir esa señal resultante de valores discretos en una señal analógica.

Rango dinámico - Ancho de banda

Rango dinámico
La calidad de los sonidos musicales grabados no es demasiado importante, ya que nunca son comparables a los reales. La razón principal es que el equipo estéreo no puede duplicar el rango dinámico completo de una orquesta o de un concierto de rock. Una orquesta puede alcanzar los 110 dB en su climax y en el punto más suave bajar hasta los 30 dB, dando lugar a un rango dinámico de 80 dB. Este rango es superior al rango dinámico de un sistema estéreo típico y, de hecho, superior a la capacidad de grabación de medios tales como un disco de vinilo y una cinta de audio.

Ancho de banda
Profundizamos ahora en aspectos prácticos, como el rango de frecuencia con el que es capaz de trabajar un reproductor CD, nuestro oido o nuestra voz. El ancho de banda es muy importante para disfrutar de la música (como manifiestan las quejas de sonido "de lata" de una radio de bolsillo) y es un criterio básico a la hora de seleccionar un equipo de audio para utilizar con la tarjeta de sonido. Por ejemplo, el ancho de banda teórico de la radio FM es aproximadamente tres veces el ancho de banda de la radio AM, por lo que la FM será capaz de reproducir frecuencias que no entran dentro del campo de trabajo de la AM.
Nota: A menudo el ancho de banda se simboliza mediante un único número cuando la frecuencia baja está bastante próxima a cero. Por ejemplo, el ancho de banda de una voz femenina se sitúa en torno a los 9 kHz, aunque realmente puede estar en el rango que va desde los 200 Hz hasta los 9 kHz.
Existe una medida estándar para definir el ancho de banda: el rango de frecuencias sobre el que la amplitud de la señal no difiere del promedio en más de 3 dB, es decir la diferencia de las frecuencias en la que se produce una caída de 3 dB, ya es el punto donde su amplitud cayó a la mitad, y éste es el mínimo cambio en la fuerza de la señal que puede ser percibido como un cambio real en la intensidad por la mayoría de los oídos.

Amplitud

Amplitud
La medida de la amplitud de una onda es importante porque informa de la fuerza, o cantidad de energía, de una onda, que se traduce en la intensidad de lo que oímos, su unidad de medida es el decibelio. Un decibelio, abreviado como dB, es una unidad de medida de la fuerza de la señal y es útil en la comparación de la intensidad de dos sonidos. La sensibilidad del oído humano es extraordinaria, con un rango dinámico o variación en intensidad muy amplio. La mayoría de los oídos humanos pueden capturar el sonido del murmullo de una hoja y, después de haberse sometido a ruidos explosivos como los de un avión, siguen funcionando. Lo que es sorprendente es que la fuerza de la explosión en un avión es al menos 10 millones de veces mayor que el murmullo que una hoja produce con el viento.
El oído necesita un porcentaje elevado de variaciones en la fuerza de un sonido para detectar un cambio en la intensidad percibida, lo que significa que la sensibilidad del oído a la fuerza del sonido es logarítmica, de manera que el decibelio, unidad de medida logarítmica, es la elección más adecuada para medir la fuerza del sonido. El aspecto práctico de la amplitud es que un incremento de sólo 3 dB duplica la intensidad de un sonido. Por ejemplo, un sonido con 86 dB tiene, el doble de fuerza que un sonido con 83 dB y cuatro veces más que un sonido con 80 dB. Desde la perspectiva de nuestra percepción de la intensidad, un incremento de 3 dB, que da lugar a que se duplique la fuerza, provoca que el sonido se perciba sólo ligeramente más alto. Es necesario un aumento en 10 dB para que nuestros oídos perciban un sonido con el doble de intensidad.

Características de una onda sencilla

Características de una onda sencilla
La forma de onda del diapasón es la más sencilla de las formas de onda, denominada onda Sinusoidal.
La frecuencia de sonido se mide en unas unidades denominadas Hertcios (Hz). Un sonido que vibra una vez por segundo tiene una frecuencia de 1 Hz. Las frecuencias se escriben normalmente en kilohertcios (kHz), unidad que representa 1.000 Hz. Una persona joven con unos oídos saludables puede oír sonidos que estén en el rango de los 20 Hz a los 20.000 Hz (20 kHz).
En la Figura se observa cómo la amplitud de la onda disminuye a medida que el sonido se aleja de su fuente, extendiéndose en todas las direcciones. (La figura exagera la rapidez con la que la onda disminuye en el aire ).
El oído y un micrófono incorporado en la tarjeta de sonido se comportan de manera similar. Ambos transforman pequeñas variaciones en la presión del aire en señal eléctrica que puede ser comprendida y almacenada por sus respectivos "cerebros" (ya sea el humano o la CPU de la computadora). Esta señal eléctrica puede ya ser guardada, manipulada o reproducida mediante los medios eléctronicos adecuados.

Sonido Digital - La naturaleza del sonido

La naturaleza del sonido
El sonido es una vibración que se propaga a través del aire, gracias a que las moléculas del aire transmiten la vibración hasta que llega a nuestros oídos. Se aplican los mismos principios que cuando se lanza una piedra a un estanque: la perturbación de la piedra provoca que el agua se agite en todas las direcciones hasta que la amplitud de las ondas es tan pequeña, que dejan de percibiese. La Figura muestra las vibraciones físicas de un diapasón que ha sido golpeado. Las vibraciones del diapasón fuerzan a las moléculas de aire a agruparse en regiones de mayor y menor densidad, dando lugar a que la presión del aire aumente o disminuya instantáneamente. El diapasón es un excelente ejemplo de fuente de sonido por dos razones: la primera es que puede observarse el movimiento de vaivén de sus brazos mientras se escuchan los resultados de esta vibración; la segunda es que el diapasón vibra a una frecuencia (vibraciones por segundo) constante hasta que toda su energía se ha disipado en forma de sonido. Una perturbación que viaja a través del aire se denomina onda y la forma que adopta esta se conoce como forma de onda.