¿Por qué una grabación estéreo XY?
La grabación con micrófonos estéreo XY auténticos tiene varias ventajas, entre las que se incluyen:
- Imagen estéreo con sonido natural
- Reproducción precisa de la amplitud y profundidad L/R
- Capacidad para capturar el sonido frontal con claridad
- Fácil conversión a mono para fines de radiodifusión
El factor clave es que NO hay diferencia de fase entre el sonido capturado por los micrófonos izquierdo y derecho. Este artículo explora cómo esta diferencia de fase afecta a la calidad del sonido comparando la grabación estéreo XY auténtica con el método estéreo AB convencional.


Técnica estéreo XY
Esta foto muestra una configuración estéreo XY con dos micrófonos emparejados. Sus diafragmas están alineados en el mismo eje y orientados en un ángulo de 90° hacia la fuente de sonido. Al colocar ambos micrófonos a la misma distancia, las ondas sonoras llegan a ellos simultáneamente, lo que evita el retardo de la señal y elimina las diferencias de fase.
Pero, ¿cuál es exactamente la relación entre el retardo de la señal y la diferencia de fase?
Para analizar esto, compararemos la grabación estéreo XY con la grabación estéreo AB..
Estéreo XY frente a estéreo AB
Las ondas de sonido que se originan en una fuente central (guitarra marrón) llegan simultáneamente a los micrófonos izquierdo y derecho, independientemente de la técnica de grabación estéreo utilizada.
Por el contrario, las ondas de sonido procedentes de una fuente descentrada (guitarra verde) llegan a los micrófonos izquierdo y derecho con un ligero retardo cuando se utiliza la configuración de micrófonos AB. En el diagrama anterior, este retardo se representa con la flecha verde, lo que indica que el sonido recorre una distancia ligeramente mayor para llegar al micrófono izquierdo.
¿Cuál es el tiempo de retardo específico de la señal descentrada que muestra la flecha verde?
Supongamos que los micrófonos en la configuración AB están separados por 48 mm. Al grabar una fuente de sonido situada en un ángulo de 45° a la derecha, el micrófono izquierdo está unos 34 mm más lejos de la fuente que el micrófono derecho. Dado que el sonido viaja a 340 m por segundo, la onda de sonido llega al micrófono izquierdo unos 0,1 milisegundos más tarde que al derecho.
¿Cómo afecta este retardo de 0,1 milisegundos a las características del audio?
El retardo causado por la distancia es constante, pero su efecto varía con la frecuencia, lo que se conoce como diferencia de fase. Cada frecuencia corresponde a una longitud de onda específica; por ejemplo, un tono de 1 kHz tiene una longitud de onda de 340 mm. Las frecuencias más altas tienen longitudes de onda más cortas: 5 kHz equivalen a 68 mm y 10 kHz a solo 34 mm.
Cuando una señal de micrófono izquierdo retardada se combina con una señal de micrófono derecho sin retardar durante la reproducción, la interacción afecta a la percepción del sonido. Por ejemplo, un tono de 1 kHz puede amplificarse ligeramente con un cambio de fase de ~40°, mientras que a 5 kHz un cambio de 180° provoca una cancelación. A 10 kHz, un cambio de 360° puede duplicar el sonido. Esto ilustra cómo la colocación del micrófono y los cambios de fase influyen en gran medida en el sonido final.
Imagina reproducir la señal retardada del micrófono izquierdo junto con la señal sin retardo del micrófono derecho a través de los altavoces. Debido a que los sonidos de ambos altavoces se mezclan en el espacio de escucha y llegan a ambos oídos, las diferencias de fase afectan significativamente lo que escuchas.
Por ejemplo, una onda sinusoidal de 1 kHz con un desplazamiento de fase de ~40° puede sonar ligeramente más alta. Sin embargo, a 5 kHz, un desplazamiento de fase de 180° hace que las ondas se cancelen completamente entre sí, de forma similar a la cancelación de ruido, haciendo que el sonido desaparezca. Por otro lado, a 10 kHz, un desplazamiento de fase completo de 360° duplica la amplitud del sonido.
Esto demuestra cómo la colocación del micrófono y los desplazamientos de fase resultantes pueden alterar el sonido de forma drástica e inesperada.

La figura anterior ilustra cómo los retardos de fase entre los canales izquierdo y derecho afectan al timbre en todas las frecuencias. El gráfico, denominado gráfico de características de frecuencia-amplitud, revela cómo un retardo de 0,125 ms hace que ciertas frecuencias (4 kHz, 12 kHz, 20 kHz) se cancelen, mientras que otras (8 kHz, 16 kHz) se refuerzan, creando un efecto de filtro de peine. Esto da como resultado un timbre distintivo claramente diferente del sonido original.
Incluso con configuraciones profesionales, la distorsión de fase sigue siendo una preocupación clave en la grabación estéreo. La comparación entre los métodos XY y AB reales lo ilustra claramente: el método XY real conserva con precisión la estructura armónica de las ondas diente de sierra, una forma de onda muy sensible a la distorsión de fase, mientras que el método AB, especialmente con una separación mayor entre los micrófonos, introduce interferencias de fase que distorsionan la forma de onda.
Este efecto de filtro de peine es claramente visible en el espectro armónico producido por la configuración AB, lo que provoca un tono nasal y pone de relieve la importancia de controlar las relaciones de fase en la grabación estéreo.
Para ilustrarlo, consideremos las grabaciones de ondas diente de sierra, muy sensibles a la distorsión de fase, capturadas con el método XY verdadero y el método AB con micrófonos muy separados.
En condiciones ideales, cuando la frecuencia fundamental a 500 Hz tiene una amplitud de 1, tus armónicos deberían disminuir proporcionalmente: 1/2 para el segundo armónico (1 kHz), 1/3 para el tercero (1,5 kHz), y así sucesivamente. El método XY verdadero conserva con precisión este equilibrio armónico, mientras que el método AB introduce interferencias de fase que distorsionan la forma de onda compuesta.
Esta distorsión se manifiesta como un pronunciado efecto de filtro de peine en el espectro armónico, lo que produce un tono nasal y antinatural.
El diseño de micrófonos estéreo XY verdaderos elimina las diferencias de fase entre los canales izquierdo y derecho, lo que garantiza grabaciones claras y estables sin coloración tonal, incluso cuando los sonidos se fusionan. Esta coherencia de fase proporciona una imagen estéreo natural, una localización precisa y una profundidad espacial realista.
Por eso, la serie ZOOM H, con micrófonos XY auténticos desde modelos compactos hasta modelos de estudio, ofrece una vía sin esfuerzo hacia un sonido profesional.