PSI 5813  COMPRESIÓN DIGITAL DE SEÑALES
 

ÁREA:  SISTEMAS ELECTRÓNICOS

Nº DE CRÉDITOS: 

Clases Teóricas :          3 
Seminarios y Otras:   0 
Horas de Estudio:        7

DURACIÓN EN SEMANAS:    12

DOCENTE RESPONSABLE:  Miguel Arjona Ramírez

OBJETIVOS: 

El contenido incluye los tópicos principales de las técnicas de cuantificación, de predicción lineal, de codificación por transformadas y de compresión sin pérdidas. Se tratan técnicas y algoritmos útiles para la construcción de sistemas que puedan atender eficientemente a las especificaciones de diseño que establecen un compromiso entre la fidelidad deseada o admisible para la reproducción de una señal y la tasa de transmisión de información necesaria o exigida. Esta asignatura establece los fundamentos necesarios para un estudio más avanzado de la compresión de voz, audio, imagen y vídeo.

JUSTIFICACIÓN: 

Las técnicas de compresión de señales son usadas tanto para la transmisión y almacenamiento compacto de señales de voz, audio o vídeo así cuanto para la manipulación de archivos de texto e imágenes. La necesidad de estas técnicas crece con el surgimiento de nuevos servicios de comunicación digital por Internet o para comunicaciones multimedia como teleconferencias y televisión digital.

 CONTENIDO:

1. Codificación sin pérdidas y codificación con pérdidas 

1.1. Autoinformación y entropía.

1.2. Frecuencias de emisión de símbolos. 

1.3. Códigos Huffman.

1.4. Entropía diferencial e información mutua. 

1.5. Problema fundamental de la codificación con pérdidas: Tasa de codificación y distorsión. Medidas de distorsión. Algoritmos y complejidad.

1.6. Teorema del muestreo. Muestreo de señales bidimensionales y de imágenes en movimiento.

1.7. Codificación sin pérdidas de secuencias de símbolos: codificación aritmética.

2. Cuantificación

2.1. Conceptos sobre cuantificadores: muestra, característica entrada-salida, error de cuantificación.

2.2. Cuantificador uniforme: tipos de características entrada-salida, regiones de cuantificación.

2.3. Modelo estadístico del error de cuantificación.

2.4. Cuantificadores no uniformes: compresor, expansor, leyes de compresión A y µ.

2.5. Cuantificadores  muestrales vectoriales: algoritmo de Linde-Buzo-Gray (LBG).

2.6. Modulación por impulsos codificados (MIC) de señales de voz, vídeo y audio. 

3. Cuantificación adaptativa

3.1. Energía a corto plazo: estimación en bloque y estimación recurrente.

3.2. Modos de estimación de los parámetros del cuantificador adaptativo: estimación progresiva y estimación regresiva.

3.3. Adaptación de la altura del escalón o paso de cuantificación. 

3.4. Control adaptativo de la ganancia de la señal de entrada.

4. Predicción fija con cuantificación adaptativa

4.1. Señal diferencial y bucle de predicción y cuantificación.

4.2. MIC diferencial (MICD o DPCM) básico, ganancia de predicción.

4.3. Espectro a largo plazo de la señal de voz y modelos de autocorrelación de imágenes.

4.4. Predicción en la codificación sin pérdidas de imágenes.

4.5. MICD adaptativo (MICDA o ADPCM) y lógicas de adaptación.

4.6. Modulación delta.

5. Predicción lineal

5.1. Predicción de la señal de voz basada en su espectro a corto plazo

5.2. Predictor variable.

5.3. Análisis predictiva.

6. Codificación con predicción adaptativa

6.1. APC con predicción adaptativa estimada progresivamente o regresivamente.

6.2. Codificadores APC con predictor a largo plazo.

6.3. Codificación con ruido retroalimentado.

6.4. Codificador predictivo excitado por señal residual.

6.5. Representación vectorial de la señal de excitación.

6.6. Codificador predictivo excitado por códigos (CELP).

7. Codificación por transformadas

7.1. Transformadas y vectores base o matrices base. 

7.2. Ganancia de transformación.

7.3. Transformada de Karhunen-Loève (KLT).

7.4. Transformada coseno discreta (DCT).

7.5. Cuantificación y codificación de los coeficientes de la transformada: asignación de bits, muestreo zonal, barredura en zigzag, codificación de longitud de secuencias nulas ("Run-Length Encoding" - RLE) y codificación Huffman.

7.6. Codificador para imágenes estáticas JPEG ("Joint Photographic Experts Group").

8. Codificación en subbandas

8.1. Codificación en subbandas (SBC): concepto y comparación con la codificación por transformadas (AT) como caso especial.

8.2. Reducción y ampliación de muestreo.

8.3. Reconstrucción perfecta.

8.4. Banco de filtros especular en la cuadratura ("quadrature-mirror filters" - QMF).

8.5. Ganancia de codificación en subbandas.

8.6. Asignación de bits entre las subbandas basada en el espectro de potencia de la señal.

8.7. Bancos de filtros con estructura en árbol.

8.8. Enmascaramiento auditivo: Relación señal a máscara (SMR), relación ruido a máscara (NMR), umbrales de enmascaramiento.

8.9. Codificación de audio MPEG ("Moving Pictures Expert Group"). 

BIBLIOGRAFÍA

[1] N. S. JAYANT, P. NOLL, Digital coding of waveforms. Englewood Cliffs: Prentice-Hall, 1984. 

[2] B. S. ATAL, V. CUPERMAN, A. GERSHO, Ed., Advances in Speech Coding.Dordrecht: Kluwer Academic Publishers,1991. 

[3] B. S. ATAL, V. CUPERMAN, A. GERSHO, Ed., Speech and audio coding for wireless and network applications. Dordrecht: Kluwer Academic Publishers, 1993.

[4] T. P. BARNWELL III, K. NAYEBI, C. H. RICHARDSON, Speech coding: A computer laboratory textbook. New York:  John Wiley & Sons, 1995.

[5] K. SAYOOD, Introduction to data compression. 2.ed, Morgan Kaufmann, 2000. 

[6] S. FURUI, Digital speech processing, synthesis, and recognition. New York: Marcel  Dekker, 1985.

[7] W. B. KLEIJN, K. K. PALIWAL, Ed., Speech Coding and Synthesis. Amsterdam:  Elsevier Science, 1995. 

[8] L. R. RABINER, R. W. SCHAFER, Digital processing of speech signals. Englewood  Cliffs: Prentice-Hall, 1978. 
 

EVALUACIÓN

En clase se propondrán ejercicios que los alumnos deben entregar resueltos una semana después. Además, se realizará una prueba intermedia y un trabajo de investigación a lo largo del curso con planeamiento inicial e informe final.
La nota final se obtiene como 
       N = 0,7P + 0,3E, 
donde P es el promedio de las notas de la prueba y del informe final y E es el promedio de las notas de los ejercicios. 

    Horario de atendimiento a los alumnos:  Miércoles de las 15:45 a las 16:45 en la sala D2-14
    Horario de clases:  Miércoles de las17:00 a las20:00 
    Profesor: Miguel Arjona Ramírez 
                       sala D2-14, tel.: 3091-5606, e-mail: miguel no lps na usp no br

    Laboratorio de Procesamiento de Señales

    SOFTWARE PARA LOS EJERCICIOS