• UABDivulga
11/2013

Propuesta de mejora en la compresión de imágenes

Los estándares de compresión de imágenes y vídeo utilizan unos esquemas de codificación en los que los píxeles de la imagen se visitan de forma ordenada. De este orden de escaneo dependen los rendimientos de compresión. Un trabajo en el que ha participado un investigador de la UAB introduce un nuevo marco teórico-práctico para evaluar y diseñar nuevos órdenes de escaneo. Los resultados experimentales demuestran que la eficacia del método propuesto es significativamente superior a la situación actual.

En la actualidad, los estándares de compresión de imágenes y vídeo utilizan unos esquemas de codificación en los que los píxeles de la imagen se visitan de forma ordenada. Esta ordenación, conocida como orden de escaneo, es importante ya que permite obtener rendimientos de compresión más o menos elevados según si los coeficientes que más aportan a la calidad de la imagen se visitan más o menos tarde.

Desde que a principios de los años noventa se introdujo la transformada wavelet para la compresión de imágenes, su uso se ha generalizado debido a los altos rendimientos de compresión que permite conseguir. Esta transformada se utiliza en la primera etapa del proceso de codificación transformando la imagen original a una representación multi-frecuencial. En esta representación, los píxeles de la imagen se llaman coeficientes wavelet. La transmisión de cada uno de estos coeficientes proporciona un incremento en la calidad de la imagen. En la figura, por ejemplo, cada bloque representa un coeficiente wavelet de una parte de una imagen, con la altura del bloque siendo el incremento de calidad que se consigue al transmitirlo. Para conseguir un sistema de compresión que aumente de forma óptima la calidad de la imagen a medida que se va transmitiendo es necesario que los coeficientes wavelet se visiten con un orden de escaneo determinado. En la figura, el orden óptimo sería aquel que empieza por el bloque negro y que va recorriendo los otros bloques progresivamente según la intensidad del color. Evidentemente, el orden de escaneo óptimo varía de imagen a imagen, de forma que no se puede utilizar siempre el mismo si se quieren conseguir resultados de compresión óptimos. Este aspecto es clave en los sistemas de codificación actuales ya que permite aumentar de forma significativa el rendimiento de compresión.

Hasta el momento, los órdenes de escaneo se diseñaban a partir de tests heurísticos sobre algún tipo de imagen o a partir de la intuición y validación experimental. La primera contribución de este trabajo es el desarrollo de un marco de trabajo teórico-práctico a partir del cual se puede diseñar y evaluar el rendimiento de los órdenes de escaneo de cualquier sistema de codificación basado en la transformada wavelet. Este marco de trabajo utiliza los últimos avances en el campo de la optimización de tasa-distorsión, lo que permite generar análisis numéricos muy precisos. En primer lugar, este marco se utiliza para analizar retrospectivamente los órdenes de escaneo utilizados hasta el momento. Esto permite justificar de forma teórica algunos de los mecanismos ampliamente extendidos en el campo pero que no tenían ninguna base teórica detrás. Segundo, el marco permite definir el máximo rendimiento que los sistemas de compresión del futuro podrán conseguir, a partir del cual se puede discernir el nivel de eficacia de los sistemas actuales. Terceramente, a partir del marco de trabajo propuesto se pueden identificar cuáles son los mejores órdenes de escaneo, proporcionando perspectiva para diseñar esquemas de compresión más eficientes.

Para demostrar la utilidad del marco de trabajo teórico-práctico, se describe un orden de escaneo óptimo para la codificación de imágenes naturales, aquellas captadas por cámaras fotográficas o de naturaleza similar. La eficacia del sistema de compresión resultante supera los estándares de compresión de imágenes actuales y los esquemas propuestos en la literatura en los últimos años.

Francesc Auli-Llinas

Referencias

Auli-Llinas, F. and Marcellin, M.W. "Scanning order strategies for bitplane image coding" IEEE Trans. Image Process., 21(4):1920-1933. Apr. 2012.

 
View low-bandwidth version