¿Qué tan alto debe sonar la voz en una mezcla?

Las voces principales deben ubicarse aproximadamente a -10 a -8 dBFS de pico en una mezcla completa, con el fader vocal ajustado para que la voz se sienta al frente sin tapar otros elementos. Un punto de partida común: sube el fader vocal hasta que puedas escucharla claramente sobre el beat completo, luego bájala 1–2 dB. El compressor vocal debe manejar la consistencia para que el fader no necesite automatización constante. Las voces de fondo típicamente se ubican 6–8 dB por debajo de la voz principal.

¿Debo usar EQ antes o después de la compresión en las voces?

Usa EQ tanto antes como después de la compresión, con diferente intención. Antes de la compresión: aplica solo EQ sustractivo — el filtro high-pass a 80–100 Hz y cualquier corte de frecuencia problemática. Esto asegura que el compressor responda a una señal más limpia sin ser disparado por el ruido de fondo o el barro. Después de la compresión: aplica EQ aditivo — boosts de presencia a 2–5 kHz y aire de high-shelf a 10 kHz. Hacer boost antes de un compressor haría que el compressor se active más fuerte en las frecuencias que acabas de impulsar.

¿Qué relación de compresión debo usar para las voces?

3:1 es la relación de partida estándar para voces principales. Proporciona un control dinámico notable sin pumping obvio. Las voces de rap con un rango dinámico más amplio suelen usar 4:1 a 6:1. Las voces de fondo necesitan menos compresión — 2:1 con un threshold más bajo. Una relación por encima de 8:1 es territorio de limitador y hará que las voces suenen poco naturales a menos que ese efecto sea intencional.

¿Cómo elimino los sonidos duros de S en las voces?

La sibilancia a 4–8 kHz se elimina con un de-esser. Ajusta la frecuencia de detección soloando una banda angosta y barriéndola por el rango de 4–8 kHz mientras reproduces una sección con muchas S ásperas. Cuando encuentres la frecuencia del pico, coloca ahí tu de-esser y ajusta el threshold para que el medidor GR solo se mueva en los sonidos S y SH — 2–4 dB de reducción suele ser suficiente. Evita el exceso de de-essing: eliminar demasiada energía por encima de 5 kHz hace desaparecer las consonantes.

¿Debo usar reverb en todas las voces?

No. Las voces de trap y hip-hop secas a menudo usan casi nada de reverb — un room muy corto (decay 0.2–0.4 s) o ninguno en absoluto. Las voces principales de pop y R&B suelen usar un plate con 1.2–1.8 s de decay. La regla es que el reverb debe reforzar la voz en el contexto de la mezcla, no hacer que suene procesada. Siempre enruta el reverb a un send, aplica un filtro high-pass a 200 Hz en el return, y mantén el nivel del return más silencioso de lo que crees necesario.

¿Cuál es la diferencia entre un de-esser y un EQ dinámico?

Ambos reducen frecuencias específicas solo cuando se supera un threshold — funcionalmente son la misma herramienta. Un de-esser dedicado como Techivation T-De-Esser Free o Lisp tiene una interfaz más simple optimizada para la sibilancia. Un EQ dinámico como TDR Nova te da más control sobre el rango de detección y la forma de reducción. Para la mayoría de las tareas de de-essing vocal, un de-esser dedicado es más rápido; para el control dinámico multibanda en todo el espectro, un EQ dinámico es más flexible.

Cómo Mezclar Voces: Guía Completa 2026

La respuesta rápida

Para mezclar voces: ajusta la ganancia a -18 dBFS, aplica un filtro high-pass a 80–100 Hz, comprime con una relación de 3:1 (attack 10–15 ms, release 60–80 ms), de-ess a 5–8 kHz, luego añade un boost de presencia en EQ a 2–5 kHz y un shelf de aire a 10 kHz. Enruta el reverb y el delay a sends, no como inserts.

Antes de mezclar: gain staging y limpieza

Una señal de entrada limpia evita que cada procesador posterior tenga que compensar problemas que no deberían existir. Haz esto antes de tocar el EQ o la compresión.

Ajusta la ganancia de entrada: modifica el clip gain (no el fader) para que el nivel vocal promedio marque alrededor de -18 dBFS RMS. Los picos pueden llegar a -10 dBFS — ese headroom es intencional.
Filtro high-pass: aplica un HPF de 24 dB/oct a 80 Hz. Las voces no contienen energía útil por debajo de este punto; cortarla evita que el rango bajo tape al kick y al bajo.
Elimina respiraciones manualmente: usa los handles de clip gain de tu DAW o un gate para reducir los transientes de respiración 10–15 dB en lugar de cortarlos por completo — eliminarlos totalmente suena antinatural.
Edita clicks y plosivos: acércate a las formas de onda al inicio de las palabras. Un pico de transiente en ángulo agudo es un click o plosivo. Aplica un fade a los primeros 5–10 ms del clip para eliminarlo.
Afina la voz (opcional): aplica corrección de pitch — Melodyne para resultados naturales, Auto-Tune para el efecto. Afina antes de cualquier procesamiento en el dominio del tiempo.

Cheat sheet de EQ vocal

Usa TDR Nova (gratis, paramétrico dinámico) o ReaEQ (gratis con REAPER) como tu EQ principal. Aplica EQ sustractivo primero en una instancia, EQ aditivo en una segunda instancia después de la compresión. Estos valores son puntos de partida — usa tus oídos y un analizador de espectro.

Frecuencia	Movimiento	Cantidad	Propósito
80–100 Hz	Corte HPF	Corte total (filtro)	Elimina ruido de fondo, vibraciones del soporte del micrófono, ruido de HVAC
200–400 Hz	Corte angosto	-2 a -4 dB	Reduce el barro y la acumulación empañada — la mayoría de las voces lo necesitan
800 Hz–1 kHz	Notch angosto	-1 a -3 dB	Corrige el tono nasal o resonante si está presente; omítelo si la voz es limpia
2–5 kHz	Boost amplio	+1 a +3 dB	Añade presencia e inteligibilidad — permite que la voz se destaque en la mezcla
8–12 kHz	Boost de high shelf	+1 a +2 dB	Aire y brillo; usa un shelf, no un pico, para un sonido natural

Regla: EQ sustractivo (cortes) antes del compressor para eliminar quirúrgicamente las frecuencias problemáticas; EQ aditivo (boosts) después del compressor para dar forma al tono final. Nunca hagas boost y corte en la misma banda de frecuencia en la misma instancia de EQ.

Configuraciones de compresión para voces

La compresión controla el rango dinámico entre las sílabas más fuertes y las más suaves. Opciones gratuitas: Analog Obsession LALA (óptico, suave para voces principales), DC1A de Klanghelm (simple, excelente para voces de fondo), TDR Kotelnikov (transparente para un glue suave). Estos son los parámetros objetivo por rol vocal.

Parámetro	Voz principal	Voz de fondo	Voz rap
Umbral	Ajusta para que el medidor GR marque -4 a -6 dB en los picos	-2 a -4 dB GR en los picos	-6 a -8 dB GR — la dinámica del rap es más amplia
Relación	3:1	2:1	4:1 a 6:1
Ataque	10–15 ms (deja pasar el transiente)	15–25 ms	5–10 ms (más ajustado, contundente)
Liberación	60–80 ms (auto o dependiente del programa)	80–120 ms	40–60 ms
Ganancia de compensación	+2 a +4 dB para compensar el GR	+1 a +3 dB	+3 a +5 dB
Objetivo GR	3–6 dB en las frases más fuertes	1–3 dB	5–8 dB

Un segundo compressor en serie (compresión en serie) es común para las voces principales: el primer compressor captura los picos grandes (threshold más alto, ratio más alto), el segundo compressor añade densidad consistente (threshold más bajo, ratio más bajo, 2:1). Cada uno hace menos trabajo — el resultado suena más transparente que un solo compressor haciendo todo el trabajo.

Reverb y delay en voces

Enruta el reverb y el delay a canales de send auxiliares — nunca los insertes directamente en la pista vocal. Esto te permite controlar el nivel wet de forma independiente y aplicar EQ o compresión al return, lo que es práctica profesional estándar.

Plate reverb (voz principal) — Decay 1.2–1.8 s. Pre-delay 20–35 ms para preservar la claridad del attack. Nivel wet en el send return: -12 a -18 dBFS. Plugin gratuito: TAL-Reverb-4 (modo plate) o Valhalla Supermassive (algoritmo Gemini o Hydra). Aplica high-pass al return del reverb a 200 Hz y un high-shelf cut por encima de 8 kHz para que quede detrás de la señal seca.
Room reverb (voces de fondo) — Decay 0.4–0.8 s. Pre-delay corto 10–15 ms. Más corto, más oscuro y más silencioso que el reverb principal. Mantiene las voces de fondo pegadas sin competir por espacio.
Delay de 1/4 de nota (voz principal) — Sincroniza el tiempo del delay a 1/4 de nota al BPM de tu proyecto. Feedback 1–2 repeticiones. Nivel wet -18 a -24 dBFS. High-pass a 400 Hz para que los ecos solo refuercen el rango medio. Plugin gratuito: Valhalla Supermassive (modo delay) o cualquier delay gratuito con sincronía de tempo. Low-pass a 6 kHz en el return del delay.
Slap delay de corchea (rap/pop) — Delay de 1/8 de nota, repetición única, nivel wet muy bajo (-24 dBFS). Añade amplitud y profundidad sin ecos audibles. Filtra con ajuste: HPF a 600 Hz, LPF a 4 kHz.

De-essing: eliminación de la sibilancia

La sibilancia — los sonidos duros de S, SH y T — se ubica en el rango de 4–8 kHz en la mayoría de los micrófonos vocales. Un de-esser es un compressor selectivo en frecuencia que solo reduce la ganancia cuando la energía en esa banda supera un threshold.

Frecuencia objetivo — Barre una banda solista por 4–8 kHz mientras reproduces una palabra con muchas S. La frecuencia donde el sonido áspero alcanza su pico es tu punto central del de-esser. Las voces femeninas típicamente tienen su pico a 6–8 kHz; las voces masculinas a 4–6 kHz.
Ajuste del threshold — Ajusta el threshold para que el medidor GR del de-esser solo se mueva en los sonidos S y SH — no en cada consonante. Empieza con -3 dB de GR en las sílabas más ásperas.
Lisp por Sleepy-Time DSP (gratuito) — Un de-esser de un solo knob con una frecuencia de detección fija. Extremadamente fácil de usar — ideal para principiantes. Efectivo en voces pop femeninas.
Techivation T-De-Esser (Gratis) — De-esser dinámico con frecuencia, threshold e intensidad ajustables. Más quirúrgico que Lisp. Funciona tanto en voces masculinas como femeninas.
TDR Nova (gratuito, modo EQ dinámico) — Coloca una banda dinámica a 5–7 kHz con un techo de -3 a -5 dB y un threshold conservador. Actúa como un de-esser transparente con control paramétrico completo sobre el rango de detección.

La cadena completa de procesamiento vocal

El orden de la cadena de señal determina cómo cada procesador interactúa con el audio. Este es el orden estándar de la industria para mezclar voces en un DAW. Cada paso parte de una entrada más limpia que el anterior.

1. Ajuste de ganancia — Ajuste del clip gain a -18 dBFS RMS antes de cargar cualquier plugin.
2. Noise gate (opcional) — Solo cuando el ruido de fondo de la sala es audible entre frases. Attack 1 ms, release 200 ms, threshold justo por debajo de la frase vocal más suave.
3. EQ sustractivo — High-pass a 80–100 Hz, corta el barro de 200–400 Hz, notch a 800 Hz si hay tono nasal. TDR Nova o ReaEQ.
4. Compresión (principal) — Relación 3:1 para voz principal, attack 10–15 ms, release 60–80 ms, 3–6 dB GR. Analog Obsession LALA o DC1A.
5. Desibilante — Objetivo 4–8 kHz, -3 dB GR solo en transientes sibilantes. Techivation T-De-Esser Free o banda dinámica de TDR Nova.
6. EQ aditivo — Boost de presencia +1 a +3 dB a 2–5 kHz, shelf de aire +1 a +2 dB a 10 kHz. El mismo plugin (TDR Nova) o una instancia separada.
7. Compresión (segundo pase opcional) — Relación más baja 2:1, threshold más bajo, 1–2 dB GR — añade densidad sin aplastar los transientes.
8. Saturación (opcional) — Excitación armónica sutil antes de los sends. Plugin gratuito: IVGI de Klanghelm (saturación tipo tape). Drive al 10–20%.
9. Send de reverb — Return auxiliar con plate reverb, decay 1.2–1.8 s, pre-delay 20–35 ms. Aplica HPF al return a 200 Hz.
10. Send de delay — Return auxiliar con delay de 1/4 de nota, 1–2 repeticiones. HPF del return a 400 Hz, LPF a 6 kHz.

Plugins gratuitos de procesamiento vocal (2026)

Todos los plugins listados son genuinamente gratuitos — sin límite de tiempo, sin funciones deshabilitadas, sin marca de agua.

TDR Nova (TDR) — EQ paramétrico y dinámico. La versión gratuita incluye cuatro bandas y es suficiente para un EQ vocal completo incluyendo de-essing. Funciona en Windows y macOS.
Analog Obsession LALA — Emulación de compressor óptico basada en el circuito LA-2A. Reducción de ganancia suave con controles mínimos de attack y release — ideal para voces principales. Gratuito en todas las plataformas.
DC1A por Klanghelm — Compressor estilo FET de dos knobs. El interruptor de carácter cambia de limpio a coloreado. Ideal para voces de fondo y compresión paralela en buses.
Valhalla Supermassive — Plugin de reverb y delay de Valhalla DSP — calidad profesional, permanentemente gratuito. Usa el algoritmo Gemini para plate, Hydra para hall largo. También cubre las funciones de send de delay.
TAL-Reverb-4 (TAL Software) — Emulación de plate reverb. Interfaz simple, densa y suave. Pre-delay hasta 250 ms. Excelente para un sonido de plate clásico en voces principales.
Techivation T-De-Esser (Gratis) — Segmentación de frecuencia ajustable, threshold e intensidad. El de-esser gratuito más capaz. Windows y macOS, VST3 y AU.
IVGI por Klanghelm — Plugin de saturación tipo tape con controles de drive y mix. Añade densidad armónica a grabaciones vocales delgadas o digitalmente limpias. Gratuito para todas las plataformas.
ReaPlugs (Cockos) — La versión independiente del paquete de plugins de REAPER. ReaEQ, ReaComp, ReaDelay, ReaGate — todos gratuitos, todos confiables, todos ligeros. Disponible fuera de REAPER.

Learning path

Preguntas frecuentes

¿Qué tan alto debe sonar la voz en una mezcla?: Las voces principales deben ubicarse aproximadamente a -10 a -8 dBFS de pico en una mezcla completa, con el fader vocal ajustado para que la voz se sienta al frente sin tapar otros elementos. Un punto de partida común: sube el fader vocal hasta que puedas escucharla claramente sobre el beat completo, luego bájala 1–2 dB. El compressor vocal debe manejar la consistencia para que el fader no necesite automatización constante. Las voces de fondo típicamente se ubican 6–8 dB por debajo de la voz principal.
¿Debo usar EQ antes o después de la compresión en las voces?: Usa EQ tanto antes como después de la compresión, con diferente intención. Antes de la compresión: aplica solo EQ sustractivo — el filtro high-pass a 80–100 Hz y cualquier corte de frecuencia problemática. Esto asegura que el compressor responda a una señal más limpia sin ser disparado por el ruido de fondo o el barro. Después de la compresión: aplica EQ aditivo — boosts de presencia a 2–5 kHz y aire de high-shelf a 10 kHz. Hacer boost antes de un compressor haría que el compressor se active más fuerte en las frecuencias que acabas de impulsar.
¿Qué relación de compresión debo usar para las voces?: 3:1 es la relación de partida estándar para voces principales. Proporciona un control dinámico notable sin pumping obvio. Las voces de rap con un rango dinámico más amplio suelen usar 4:1 a 6:1. Las voces de fondo necesitan menos compresión — 2:1 con un threshold más bajo. Una relación por encima de 8:1 es territorio de limitador y hará que las voces suenen poco naturales a menos que ese efecto sea intencional.
¿Cómo elimino los sonidos duros de S en las voces?: La sibilancia a 4–8 kHz se elimina con un de-esser. Ajusta la frecuencia de detección soloando una banda angosta y barriéndola por el rango de 4–8 kHz mientras reproduces una sección con muchas S ásperas. Cuando encuentres la frecuencia del pico, coloca ahí tu de-esser y ajusta el threshold para que el medidor GR solo se mueva en los sonidos S y SH — 2–4 dB de reducción suele ser suficiente. Evita el exceso de de-essing: eliminar demasiada energía por encima de 5 kHz hace desaparecer las consonantes.
¿Debo usar reverb en todas las voces?: No. Las voces de trap y hip-hop secas a menudo usan casi nada de reverb — un room muy corto (decay 0.2–0.4 s) o ninguno en absoluto. Las voces principales de pop y R&B suelen usar un plate con 1.2–1.8 s de decay. La regla es que el reverb debe reforzar la voz en el contexto de la mezcla, no hacer que suene procesada. Siempre enruta el reverb a un send, aplica un filtro high-pass a 200 Hz en el return, y mantén el nivel del return más silencioso de lo que crees necesario.
¿Cuál es la diferencia entre un de-esser y un EQ dinámico?: Ambos reducen frecuencias específicas solo cuando se supera un threshold — funcionalmente son la misma herramienta. Un de-esser dedicado como Techivation T-De-Esser Free o Lisp tiene una interfaz más simple optimizada para la sibilancia. Un EQ dinámico como TDR Nova te da más control sobre el rango de detección y la forma de reducción. Para la mayoría de las tareas de de-essing vocal, un de-esser dedicado es más rápido; para el control dinámico multibanda en todo el espectro, un EQ dinámico es más flexible.

Cómo Mezclar Voces: Guía Completa 2026 (2026)

La respuesta rápida

Antes de mezclar: gain staging y limpieza

Cheat sheet de EQ vocal

Configuraciones de compresión para voces

Reverb y delay en voces

De-essing: eliminación de la sibilancia

La cadena completa de procesamiento vocal

Plugins gratuitos de procesamiento vocal (2026)

Related answer hubs

Preguntas frecuentes

La respuesta rápida

Antes de mezclar: gain staging y limpieza

Cheat sheet de EQ vocal

Configuraciones de compresión para voces

Reverb y delay en voces

De-essing: eliminación de la sibilancia

La cadena completa de procesamiento vocal

Plugins gratuitos de procesamiento vocal (2026)

Related answer hubs

Recursos gratuitos en Plugg Supply

Sage Audio SA1064 v1.0.2 [MacOSX]

Nuro Audio Xvox Pro v1.5.2 [WiN]

Nuro Audio Xvox v1.1.3 [WiN]

Nuro Audio Xrider v1.5.1 [WiN]

WA Production Biggifier By Aden v1.1 [MacOSX]

oeksound soothe2 v1.3.3 [U2B] [MacOSX]

Preguntas frecuentes