Compresión Perceptual de Audio Digital -- Resumen
En este documento se presenta la implementación de un
codificador-decodificador perceptual de sonido que toma como entrada un
archivo sin comprimir, muestreado a 44100Hz,
cuantizado a 16-bits, estéreo. La señal es procesada en bloques de 512
muestras,
y transformada utilizando Transformada Discreta de Coseno Modificada.
Estos coeficientes son
cuantizados utilizando información de un modelo psicoacústico y
posteriormente
empaquetados a un archivo utilizando tasa de datos variable. El
decodificador toma este archivo y
su salida es un archivo con las mismas características que el de origen.
Las tasas de datos
promedio observadas varían entre 58kbps y 340kbps, estando la más común
localizada por arriba
de 240kbps. Se muestran resultados de pruebas comparativas de calidad
subjetiva entre el
formato implementado, MPEG-1 Layer 3 y MPEG-4 Low Complexity Advanced
Audio
Coding. El codificador-decodificador implementado logra un perfil de
alta calidad de acuerdo
a los resultados obtenidos.
Intervalo de confianza de un 99%, HSD de Tukey=0.085
No hay comentarios:
Publicar un comentario