Codificação de Voz |
Área de Concentração: | 3142 | |||
Criação: | 29/04/2004 | |||
Ativação: | 13/04/2014 | Desativação: | ||
Nr. de Créditos: | 8 |
Carga Horária | ||||
Teórica (por semana) |
Prática (por semana) |
Estudos (por semana) |
Duração | Total |
3 | 0 | 7 | 12 semanas | 120 horas |
Docente Responsável: | ||
Miguel Arjona Ramírez |
Objetivos |
Familiarizar os alunos com as técnicas modernas de codificação de voz e, principalmente, através do exercício do pensamento crítico sobre os seus fundamentos, estimular a busca de melhoramentos e alternativas a essas técnicas vigentes. |
Justificativa |
As técnicas de codificação do sinal de voz são usadas tanto para a transmissão quanto para o armazenamento compacto de sinais de voz. Elas são demandadas para a transmissão compartilhada de vários canais de voz em comunicações telefônicas digitais tanto na rede fixa quanto na rede celular móvel, além de permitir maior segurança e sigilo pelo recurso à criptografia. Ainda, os canais compartilhados podem transportar vídeo ou dados em ambientes multimídia, que estão se tornando cada vez mais frequentes e nos quais a versatilidade de dispor de codificadores operando a várias taxas de compressão permite estabelecer compromissos entre qualidade de serviço e quantidade de canais, necessários para atender a demanda da telefonia por rede de pacotes como a Internet. |
Conteúdo |
1. Introdução 1.1. Introdução à codificação de voz: Problema básico. 1.2. Medidas de distorção e medidas de fidelidade ou semelhança. 1.3. Capacidade do canal telefônico e taxa de transmissão. 1.4. Taxa de informação fonética. 1.5. Taxa de codificação e sua relação com a distorção. 1.6. Características tempo-frequenciais básicas do sinal de voz: os espectrogramas. 1.7. Codificador de voz analógico. 2. Predição linear 3.Quantização
4. Compansão e
quantização vetorial 5. Quantização
adaptativa 6. Predição fixa com
quantização adaptativa 7. Vocoders baseados na
predição linear 8. Codificação com
predição adaptativa 9. Determinação da
excitação por análise-mediante-síntese
10. Codificação
frequencial e tempo-frequencial |
Forma de Avaliação |
A cada aula
serão propostos exercícios que devem ser resolvidos para
a aula seguinte. Além disso, será realizada uma prova intermediária e um trabalho de pesquisa no decorrer do curso com planejamento inicial e relatório final. A nota de aproveitamento será obtida por N = 0,7P + 0,3E, onde P é a média das notas da prova e do relatório final e E é a média das notas dos exercícios. Horário
de atendimento aos alunos: Terças-feiras das 15:45
às 16:45 na
sala D2-14. Professor:
Miguel Arjona Ramírez |
Bibliografia |
[1] N. S. JAYANT, P. NOLL, Digital coding of waveforms.
Englewood Cliffs: Prentice-Hall, 1984. [2] W. C. CHU, Foundation and evolution of standardized coders. New York: John Wiley & Sons, 2003. [3] A. M. KONDOZ, Digital Speech: Coding for low rate communication systems. New York: John Wiley & Sons, 2004. [4] M. ARJONA RAMÍREZ, M. MINAMI, Low bit rate speech coding. In: J. G. PROAKIS (Ed.) Wiley Encyclopedia of Telecommunications. New York: Wiley, 2003, v. 3, p. 1299-1308. [5] M. ARJONA RAMÍREZ, M. MINAMI, Technology and Standards for Low-Bit-Rate Vocoding Methods. In: H. BIDGOLI (Ed.) The Handbook of Computer Networks. New York: Wiley, 2008, v. 2, p. 447-467. [6] B. S. ATAL, V. CUPERMAN, A. GERSHO, Ed., Advances in Speech Coding.Dordrecht: Kluwer Academic Publishers, 1991. [7] B. S. ATAL, V. CUPERMAN, A. GERSHO, Ed., Speech and audio coding for wireless and network applications. Dordrecht: Kluwer Academic Publishers, 1993. [8] T. P. BARNWELL III, K. NAYEBI, C. H. RICHARDSON, Speech coding: A computer laboratory textbook. New York: John Wiley & Sons, 1995. [9] S. FURUI, Digital speech processing, synthesis, and recognition. New York: Marcel Dekker, 1985. [10] W. B. KLEIJN, K. K. PALIWAL, Ed., Speech Coding and Synthesis. Amsterdam: Elsevier Science, 1995. [11] L. R. RABINER, R. W. SCHAFER, Digital processing of speech signals. Englewood Cliffs: Prentice-Hall, 1978. |
|