lunes, 6 de mayo de 2019

Estandares de Voz


HISTORIA DE LOS CODIFICADORES


Hace unos cincuenta años que empezó la investigación en el campo de la codificación de la voz. El pionero fue Homer Dudley, que trabajaba en los laboratorios de la Bell Telephone. La motivación a esta investigación surgió por la necesidad de transmitir voz por los cables de telegrafía de pequeño ancho de banda. La idea del vocoder (VOIce CODER, codificador de voz) de Dudley era analizar la voz para extraer una serie de características y que el emisor enviase esas características, cuando éstas le llegasen al receptor reconstruiría la voz original. Este codificador recibió gran atención durante la Segunda Guerra Mundial, debido a su potencial en cuanto a eficiencia y posibilidad de encriptación se refiere.
Las primeras implementaciones del vocoder eran analógicas, sin embargo, con el nacimiento de los sistemas digitales y de las posibilidades que éstos ofrecen, pronto se pasó a las implementaciones digitales. Durante la década de los 40 hubo una gran actividad en la Codificación por Modulación de Impulsos (PCM). Este tipo de codificación no sigue la filosofía del vocoder de Dudley (y de los vocoders en general), sino que simplemente muestrea la voz. A partir del PCM se desarrollaron el DPCM y el ADPCM, que fueron propuestos como estándar por la CCITT (International Consultative Committee for Telephone and Telegraph).
Gracias a la flexibilidad de los sistemas digitales, se pudo experimentar con formas más sofisticadas de representación de la voz. Fant, a finales de los 50, trabajó en el modelo de producción de voz lineal.
El surgimiento de la tecnología VLSI, tecnología de muy baja escala de integración, durante los 60 y 70 permitió nuevas soluciones al problema de la codificación de la voz. Así, por ejemplo, Flanagan y Golden propusieron una solución basada en la Transformada de Fourier.

ESTANDARES DE CODIFICACION DE VOZ


Definición.

La codificación es el proceso de transformación de una señal analógica a una señal digital que pueda ser transmitida por canales de ancho de banda bajo.

Pasos en el proceso de estándares.

Los pasos que se siguen en este proceso son:

Filtro pasa banda:

 Este limita el rango de frecuencia que se desea muestrear y reducir así los bits necesarios para digitalizar la señal analógica. -

Muestreo:

Convierte la señal analógica en una señal de valores discretos. -

Cuantificación:

Asigna un valor binario a las muestras obtenidas en la fase de muestreo. -

Codificación:

Existen diversas técnicas de codificación.

PCM (Pulse Code Modulation)

Es la modulación por pulsos codificados (básicamente es el proceso de cuantificación). -

DPCM (Differencia Pulse Code Modulation)

Que codifica la diferencia entre dos señales consecutivas. -

ADPCM (Adaptive Differencial Code Modulation)

Que se adapta dinámicamente a los diferentes tipos de señal aumentando o disminuyendo la resolución.

ESTANDARES ESPEFICIDADOS POR ITU-T


Los estándares especificados por la ITU-T para la codificación de audio son G.711, G.722, G.723, G.728 y G.729.

G.711

Es el estándar de codificación de audio para telefonía y videotelefonía. Se basa en codificar muestras de la señal de audio a 8 KHz y asignar a esas muestras un código de 8 bits con el que conseguimos tener 256 posibles valores de la muestra con flujos de 64 Kbps. Es lo que se llama modulación por impulsos codificados (PCM).

G.722

Este estándar utiliza la técnica ADCPM, es decir, no codifica el valor de la muestra sino la diferencia con el valor anterior de la muestra que se puede codificar con menos bits al ser una diferencia muy pequeña. Así, en este estándar se muestrea la señal a 16 KHz y se asignan códigos de 4 bits consiguiendo tener 16 posibles valores de la señal y obteniendo así mayor calidad que con el estándar G.711. Si en el anterior estándar se convertían frecuencias de 3.1 KHz a 64 Kbps, este consigue convertir frecuencias de entre 50 Hz y 7 KHz a 5.3 y 6.3 Kbps reduciendo así el empleo de ancho de banda.


G.723

Al igual que G.722 comprime frecuencias comprendidas entre 50 Hz y 7KHz pero lo hace a canales de 48, 56 y 64 Kbps, consiguiendo así mayor disponibilidad y mayor calidad en la transmisión y recepción.

G.728

Este estándar se basa en fórmulas matemáticas para reproducir la señal y lo que codifica son los parámetros predictores utilizados en esas fórmulas para los que sólo son necesarios 2 bits con los que conseguimos sólo 4 niveles de cuantificación para la señal con 16 Kbps. Consigue codificar frecuencias de 3.1 KHz a flujos de 16 Kbps.

G.729

Estándar equivalente a G.728 pero se reduce el régimen binario de 16 Kbps a 8 Kbps permitiendo comprimir así los 64 Kbps.


 

No hay comentarios.:

Publicar un comentario