Compressão Digital de Sinais

PSI 5813 COMPRESSÃO DIGITAL DE SINAIS

ÁREA: SISTEMAS ELETRÔNICOS

Nº DE CRÉDITOS:

Aulas Teóricas :            3
Seminários e Outros:   0
Horas de Estudo:           7

DURAÇÃO EM SEMANAS:    12

DOCENTE RESPONSÁVEL: Miguel Arjona Ramírez

OBJETIVOS:

O conteúdo inclui os tópicos principais das técnicas de quantização, de predição linear, de codificação por transformadas e de compressão sem perdas. A disciplina visa ao tratamento de técnicas e de algoritmos úteis para a construção de sistemas que possam atender eficientemente as especificações de projeto que estabelecem o compromisso entre a fidelidade desejada ou admissível na reprodução de um sinal e a taxa de transmissão de informação necessária ou exigida. Esta disciplina estabelece os fundamentos necessários para um estudo mais avançado da compressão de voz, áudio, imagem e vídeo.

JUSTIFICATIVA:

As técnicas de compressão de sinais são usadas tanto para a transmissão e armazenamento compacto de sinais de voz, áudio ou vídeo bem como para a manipulação de arquivos de texto e imagens. A necessidade destas técnicas cresce com o surgimento de novos serviços de comunicação digital através da Internet ou para comunicações multimídia como teleconferências e televisão digital.

CONTEÚDO:

1. Codificação sem perdas e codificação com perdas

1.1. Autoinformação e entropia.

1.2. Frequências de emissão de símbolos.

1.3. Códigos de Huffman.

1.4. Entropia diferencial e informação mútua.

1.5. Problema fundamental da codificação com perdas: Taxa de codificação e distorção. Medidas de distorção. Algoritmos e complexidade.

1.6. Teorema da amostragem. Amostragem de sinais bidimensionais e de imagens em movimento.

1.7. Codificação sem perdas de sequências de símbolos: codificação aritmética.

2. Quantização

2.1. Conceitos sobre quantizadores: amostra, característica entrada-saída, erro de quantização.

2.2. Quantizador uniforme: tipos de características entrada-saída, regiões de quantização.

2.3. Modelo estatístico do erro de quantização.

2.4. Quantizadores não-uniformes: compressor, expansor, leis de compansão A e µ.

2.5. Quantizadores amostrais vetoriais: algoritmo de Linde-Buzo-Gray (LBG).

2.6. Codificação PCM de sinais de voz, vídeo e áudio.

3. Quantização adaptativa

3.1. Energia de curto prazo: estimação por bloco e estimação recorrente.

3.2. Modos de estimação dos parâmetros do quantizador adaptativo: estimação progressiva e estimação regressiva.

3.3. Adaptação da altura do degrau ou passo de quantização.

3.4. Controle adaptativo do ganho do sinal de entrada.

4. Predição fixa com quantização adaptativa

4.1. Sinal diferencial e malha de predição e quantização.

4.2. PCM diferencial (DPCM) básico, ganho de predição.

4.3. Espectro de longo prazo do sinal de voz e modelos de autocorrelação de imagens.

4.4. Predição na codificação sem perdas de imagens.

4.5. DPCM adaptativo (ADPCM) e lógicas de adaptação.

4.6. Modulação delta.

5. Predição linear

5.1. Predição do sinal de voz com base em seu espectro de curto prazo.

5.2. Preditor variável.

5.3. Análise preditiva.

6. Codificação com predição adaptativa

6.1. APC com predição adaptativa estimada progressivamente ou regressivamente.

6.2. Codificadores APC com preditor de longo prazo.

6.3. Codificação com realimentação de ruído.

6.4. Codificador preditivo excitado por sinal residual.

6.5. Representação vetorial do sinal de excitação.

6.6. Codificador preditivo excitado por códigos (CELP).

7. Codificação por transformadas

7.1. Transformadas e vetores-base ou matrizes-base.

7.2. Ganho de transformação.

7.3. Transformada de Karhunen-Loève (KLT).

7.4. Transformada cosseno discreta (DCT).

7.5. Quantização e codificação dos coeficientes da transformada: alocação dos bits, amostragem zonal, varredura em ziguezague, codificação dos comprimentos de sequências nulas ("Run-Length Encoding"- RLE) e codificação de Huffman.

7.6. Codificador para imagens estáticas JPEG ("Joint Photographic Experts Group").

8. Codificação em sub-bandas

8.1. Codificação em sub-bandas (SBC): conceituação e comparação com a codificação por transformadas (AT) como caso especial.

8.2. Compressão e expansão da taxa de amostragem.

8.3. Reconstrução perfeita.

8.4. Banco de filtros especular na quadratura ("quadrature-mirror filters" - QMF).

8.5. Ganho de codificação em sub-bandas.

8.6. Alocação de bits entre as sub-bandas a partir do espectro de potência do sinal.

8.7. Bancos de filtros estruturados em árvore.

8.8. Mascaramento auditivo: Relação sinal-máscara (SMR), relação ruído-máscara (NMR), limiares de mascaramento.

8.9. Codificação de áudio MPEG ("Moving Pictures Expert Group").

BIBLIOGRAFIA

[1] N. S. JAYANT, P. NOLL, Digital coding of waveforms. Englewood Cliffs: Prentice-Hall, 1984.

[2] B. S. ATAL, V. CUPERMAN, A. GERSHO, Ed., Advances in Speech Coding.Dordrecht: Kluwer Academic Publishers, 1991.

[3] B. S. ATAL, V. CUPERMAN, A. GERSHO, Ed., Speech and audio coding for wireless and network applications. Dordrecht: Kluwer Academic Publishers, 1993.

[4] T. P. BARNWELL III, K. NAYEBI, C. H. RICHARDSON, Speech coding: A computer laboratory textbook. New York: John Wiley & Sons, 1995.

[5] K. SAYOOD, Introduction to data compression. 2.ed, Morgan Kaufmann, 2000.

[6] S. FURUI, Digital speech processing, synthesis, and recognition. New York: Marcel Dekker, 1985.

[7] W. B. KLEIJN, K. K. PALIWAL, Ed., Speech Coding and Synthesis. Amsterdam: ElsevierScience, 1995.

[8] L. R. RABINER, R. W. SCHAFER, Digital processing of speech signals. Englewood Cliffs: Prentice-Hall, 1978.

AVALIAÇÃO

A cada aula serão propostos exercícios que devem ser resolvidos para a aula seguinte.
Além disso, será realizada uma prova intermediária e um trabalho de pesquisa no decorrer do curso com planejamento inicial e relatório final.
A nota de aproveitamento será obtida por
       N = 0,7P + 0,3E,
onde P é a média das notas da prova e do relatório final e E é a média das notas dos exercícios.

Horário de atendimento aos alunos: Terças-feiras das 15:45 às 16:45 na sala D2-14

Horário de aulas:  Terças-feiras das 17:00 às 20:00 na sala B2-01

Professor: Miguel Arjona Ramírez
                     sala D2-14, tel.: 3091-5606, e-mail: miguel no lps na usp no br

Laboratório de Processamento de Sinais

SOFTWARE PARA OS EXERCÍCIOS