跳至主要内容

音频压缩详解:是什么,以及如何使用

了解什么是音频压缩以及如何使用。涵盖阈值、比率、起音、释音、补偿增益、拐点,以及鼓组、人声、bass 和混音总线的实际压缩技术。

音频压缩详解:是什么,以及如何使用

音频压缩通过自动降低超过设定电平(阈值)的信号来减少动态范围,由五个关键参数控制:阈值比率起音释音补偿增益。压缩器用于为混音添加冲击感延音粘合感

什么是音频压缩?

想象一个歌手低语时达到 -30 dB 但喊叫时达到 0 dB——30 dB 的波动会让你每秒都伸手去调推子。音频压缩自动解决了这个问题。压缩器是一种动态处理器,检测信号何时超过设定电平(阈值),并以固定量将其降低(比率)。结果是曲目最安静和最响亮部分之间的差距缩小——工程师称之为减少的动态范围。

但压缩不仅仅是音量校正器。细腻使用(2-4 dB 的增益压缩)时,它为鼓组增加冲击感,为吉他和人声增加延音,为完整混音总线增加粘合感。激进使用时,它创造现代嘻哈人声或 EDM 高潮的那种进击、直冲人脸的能量。压缩器上的每个参数——阈值、比率、起音、释音、补偿增益和拐点——都给你对什么被压缩、何时以及压缩多少的精确控制。这就是为什么理解压缩是音乐制作中杠杆效率最高的技能之一。

5 个关键参数:阈值、比率、起音、释音、补偿增益

阈值(Threshold)

阈值是压缩器开始工作的音量电平(以 dB 计)。任何超过阈值的信号触发增益压缩。任何低于阈值的信号原样通过。

  • 何时调整: 设置阈值使最响的峰值——不是平均电平——成为被压缩的部分。观察增益压缩表:你希望在最响的击打上有 3-6 dB 的压缩,而不是对所有内容持续 -10 dB 的压缩。
  • 典型范围: 人声总线为 -20 dB 到 -40 dB;鼓组为 -10 dB 到 -30 dB;完整混音约 -40 dB 到 -50 dB 的温和设置。
  • 提示: 先设置比率和起音,然后缓慢提高阈值,直到你在最响的峰值上看到 GR 表移动。

比率(Ratio)

比率告诉你超过阈值的输入信号每多少 dB 会产生 1 dB 的输出。4:1 的比率意味着输入每超过阈值 4 dB,输出只上升 1 dB。

  • 何时调整: 低比率(1.5:1-2:1)是透明且具音乐性的——适合温和的电平均衡。中等比率(3:1-6:1)在没有明显效果的情况下增加密度和控制力。高比率(8:1-20:1)接近限制,用于激进的人声存在感或防止数字削波。
  • 典型范围: 透明混音总线粘合 2:1-4:1;单独轨道控制 4:1-6:1;效果或限制 8:1-20:1。
  • 提示: 如果你的人声在 4:1 时仍然过于动态,通常最好是以更低的阈值加入第二台压缩器,而不是将比率提升到 10:1。

起音(Attack)

起音控制信号越过阈值后压缩器降低增益的速度。以毫秒(ms)为单位,快速起音意味着压缩器几乎立即夹紧;慢速起音在压缩启动之前让初始瞬态通过。

  • 何时调整: 放慢起音(20-50 ms)让鼓组瞬态穿透——这是你增加冲击感而不是破坏它的方式。加快起音(1-10 ms)控制人声齿擦音或驯服刺耳的拨弦吉他峰值。
  • 典型范围: 激进峰值控制 0.1-10 ms;保留瞬态的音乐性工作 10-50 ms;几乎完全避免影响起音瞬态时 50-100 ms。
  • 提示: 在嘻哈和流行混音中,军鼓和底鼓瞬态是神圣的。如果你的鼓组总线压缩器正在吃掉底鼓的初始击打,退后起音直到瞬态再次呼吸。

释音(Release)

释音控制信号降回阈值以下后压缩器停止降低增益的速度。快速释音让信号在击打之间快速恢复;慢速释音保持压缩更长时间,创造更平滑、更持续的声音。

  • 何时调整: 短释音(30-80 ms)适用于踩镲或激进军鼓等快速、断奏音源。较长释音(100-300 ms)创造更平滑、更融合的声音——理想用于人声或混音总线。释音太快会产生伪像(可听到的泵浦感);释音太慢会在应该停止时保持增益压缩激活,使律动变平。
  • 典型范围: 打击性音源 30-80 ms;人声和 bass 80-200 ms;混音总线 200-500 ms。
  • 提示: 释音的好起点约为你节奏一拍的 1/4 到 1/3。在 120 BPM 时,约为 125-250 ms。凭耳朵调整,直到压缩感觉音乐性而非机械性。

补偿增益(Makeup Gain)

一旦压缩器衰减信号,输出就会更安静。补偿增益是一个简单的音量控制,用于在压缩后恢复感知响度。它不会撤销压缩——它只是让被压缩的信号更响。

  • 何时调整: 设置阈值、比率、起音和释音后,提高补偿增益,直到被压缩的信号坐在与原始信号相同的响度(或更响,如果你希望它主导混音)。目标是让被压缩的版本相对于混音的其余部分处于正确的电平。
  • 典型范围: 0 到 +15 dB,取决于你应用了多少压缩。
  • 提示: 使用增益压缩表作为你的向导,而不仅仅是你的耳朵。如果你应用了 6 dB 的增益压缩,你需要大约 6 dB 的补偿增益来匹配原始电平。在匹配电平下比较是 A/B 对比压缩的唯一诚实方式。

拐点(Knee):硬拐点 vs 软拐点

大多数压缩器都有拐点控制——固定硬拐点或可调软拐点。拐点定义了随着信号接近并越过阈值,压缩器从无压缩到全比率压缩过渡的渐进程度。

硬拐点:信号越过阈值的瞬间压缩器立即应用全比率。这更激进,听起来可能很突兀,但提供精确的控制。经典的 SSL 风格总线压缩器使用硬拐点。

软拐点(或可变拐点):随着信号接近阈值,压缩器逐渐开始应用比率,创造更平滑、更具音乐性的过渡。这对于细腻的压缩任务往往听起来更自然。

  • 何时使用硬拐点: 当你想要激进、精确的增益控制时——在鼓组总线上、限制器式应用中,或当你想听到压缩「抓握」的感觉时。
  • 何时使用软拐点: 对于温和、音乐性的压缩,感觉像是在增加密度而不是处理。在完整混音总线或精致的原声人声上,软拐点通常是正确的选择。
  • 典型范围: 硬拐点用于冲击感和激进的混音粘合;软拐点(有时称为「温暖」或「复古」模式)用于透明度。

压缩 vs 限制:有什么区别?

压缩和限制是相同的电路——区别在于比率。比率超过 10:1 的压缩器实际上就是限制器。但实际差异很重要:

压缩器(比率最高约 10:1)在保留一些动态运动的同时减少动态范围。峰值仍然呼吸。结果感觉有生气。

限制器(比率 10:1 及以上,有时为无限:1)防止信号超过阈值任何有意义的量。它是主总线数字削波前的最后一道防线。限制器不是关于音调的——而是关于保护和电平的。

将压缩器视为混音工具,将限制器视为安全网。你使用压缩来随时间塑造曲目的感觉。你使用限制来捕捉偶尔出现的会削波的杂散峰值,或人为提高响度以达到竞争性的流媒体电平。

如何读取压缩器表(GR,增益压缩)

每个压缩器都有增益压缩(GR)表。这是设备上最重要的表——在很多情况下比输入或输出表更重要。

GR 表显示压缩器当前从信号中减去多少 dB,以负数表示(因为输出正在被减少)。-4 dB 的读数意味着输出已被衰减 4 dB。-8 dB 意味着重度压缩。

要观察什么:

  • 峰值处一致的 -2 到 -4 dB GR: 这是细腻混音总线粘合的好起点。
  • 偶尔跳到 -8 或 -10 dB 的峰值 GR: 对于激进的人声或鼓组压缩是正常的——只是不要让它持续在那里。
  • GR 表完全没有移动: 阈值设置得太高——信号从未超过它。
  • -6 dB 或更多的持续 GR: 要么阈值太低,要么比率对于素材来说太高。

大多数插件将 GR 显示为在黄色或绿色刻度上向左摆动的指针。模拟仿真往往有非常清晰的 GR 表——使用它们。它们告诉你压缩器实际上对你的音频做了什么,这比观察输入或输出表更有用。

常见的压缩用途:鼓组、人声、Bass、完整混音

鼓组(Drums)

鼓组压缩是冲击感延音之间选择最可听到的地方。鼓组总线或单独底鼓和军鼓声道上的快速起音(1-10 ms)、中等比率(4:1-6:1)和短释音(50-100 ms)收紧声音并控制峰值。较慢的起音(20-50 ms)让瞬态通过以获得更有力的感觉。

一个经典方法:单独压缩底鼓和军鼓(比率 4:1,阈值设置使你在最重的击打上获得 3-4 dB GR),然后以较慢的起音对整个鼓组套件进行总线压缩以获得粘合感。

人声(Vocals)

人声需要压缩以在混音中保持一致,不被器乐淹没。3:1-4:1 的比率,阈值设置为捕捉最响的乐句(通常是高喊峰值),是可靠的起点。约 10-30 ms 的起音保留了人声的辅音和起音。

对于有激进演唱的说唱人声,你可能希望更快的起音(3-10 ms)来驯服瞬态并创造那种直冲人脸的能量。对于精致的民谣人声,非常慢的起音(30-50 ms)保持自然的动态完整。

Bass

Bass 吉他和 808 底鼓受益于压缩来均衡音符之间的不一致性并增加延音。8:1-10:1 的比率搭配中慢起音(10-30 ms)让初始瞬态通过同时控制音符的主体。约 100-200 ms 的释音防止压缩在音符之间释放并产生伪像。

特别是在 808 上:长衰减意味着压缩器需要慢速释音来避免在音符中途释放,否则会产生泵浦伪像。

完整混音总线(Full Mix Bus)

混音总线压缩器是最具争议的——一些工程师不使用,其他人对 SSL 风格总线压缩器上 1-2 dB 的压缩深信不疑。目标不是控制动态,而是添加让单个轨道感觉它们属于一起的声音粘合感。

从 2:1-4:1 的比率开始,阈值设置使你在最响的时刻看到 1-3 dB 的 GR,起音约 10-30 ms(慢到足以让瞬态通过,快到足以抓住峰值),释音约 100-200 ms。结果应该听起来像混音只是更有凝聚力——不是明显被压缩了。

并联压缩:秘密武器

并联压缩——也称为纽约压缩总线压缩——是最强大的混音技术之一,因为它让你在没有缺点的情况下添加压缩。

原理:将干(未压缩)信号与同一信号的重度压缩副本混合。干信号保留原始的动态和瞬态。被压缩的信号增加密度、延音和粘合感。混合给你两者的最佳效果。

何时使用:

  • 军鼓: 当你既想要初始击打的劲道,又想要鼓体的持续铃声时。
  • 人声: 当压缩器正在增加主体和温度,但破坏了空气感和存在感时。
  • 完整鼓组总线: 当单个击打需要冲击感,但整套鼓需要感觉像一件乐器时。
  • 任何音源: 当你想听到「被压缩了」的效果,而又不让它听起来「被处理了」时。

如何设置:

  1. 创建并联总线
    创建一个并联总线(辅助发送/返回或 DAW 中的复制声道)。
  2. 发送你的目标轨道
    将你的目标轨道发送到这个总线。
  3. 插入压缩器
    在并联总线上插入一个具有激进设置的压缩器(比率 6:1-10:1,快速起音,中等释音,阈值低到足以获得 8-12 dB 的 GR)。
  4. 混合并联信号
    将并联压缩信号与干轨道混合,直到你听到密度和重量感,而没有明显的被压缩感。

并联鼓组的经典比率是 6:1-8:1,起音约 10 ms,释音约 100 ms。你在这里不是要细腻——你在构建一个与原始信号混合的压缩层。

免费压缩插件入门

学习压缩不需要昂贵的插件。以下是最佳免费选项:

  • TDR Kotelnikov (Tokyo Dawn Labs)——一款透明的宽频动态处理器,具有可变拐点和出色的电平表。非常适合混音总线和主总线工作。
  • DC1A (Klanghelm)——一款只有两个旋钮的简单、音乐性压缩器。平滑、透明,非常适合在不迷失于参数的情况下学习压缩如何塑造动态。
  • RoughRider 3 (Audio Damage)——一款具有独特「粗糙度」控制的特色压缩器,可添加谐波丰富度。非常适合鼓组、并联压缩,以及为任何音源添加个性。
  • OTT (Xfer Records)——一款已成为 EDM 制作中必备的多段上/下压缩器。不是传统压缩器,但理解多段压缩如何塑造音调对任何流派都是有价值的。
  • MCompressor (MeldaProduction)——一款具有旁链选项和深度参数控制的高度灵活的压缩器。可用的最完整的免费动态处理器之一。

有关最佳免费压缩插件的完整分析,包括比较和使用场景推荐,请参阅我们关于音乐制作最佳免费压缩插件的指南。

压缩器类型对比

类型电路设计特性最佳用途
VCA电压控制放大器——快速、精确透明、准确、干净;在极端情况下添加轻微数字边缘感混音总线、鼓组、bass、精确人声控制
FET场效应晶体管——快速、激进的增益控制激进、快速、有色彩;添加谐波特性摇滚人声、军鼓、激进鼓组、并联压缩
光电(Opto)光元件和光敏电阻——慢速、音乐性平滑、慢速、温暖;感觉非常自然人声、原声乐器、温和的混音总线粘合
可变 Mu(Vari-mu)电子管/真空管——慢速、富含谐波温暖、音乐性、与信号协作;可增加低频厚度混音总线、bass、管弦乐、任何需要温度的音源

从哪种开始?VCA 压缩器(如经典的 dbx 160 或 SSL 总线压缩器)是最可预测的,是最好的学习工具。一旦你理解了阈值、比率、起音和释音在干净的 VCA 上如何交互,FET 和光电压缩器的特色性格就会更有意义。

总结

音频压缩是控制动态范围的艺术——拉低最响的峰值让最安静的时刻能够呼吸,为单薄的声音增加密度,并将不相关的轨道粘合成有凝聚力的混音。五个核心参数——阈值比率起音释音补偿增益——像混音台上的控制器一样协同工作。阈值设置触发点;比率设置深度;起音和释音设置时机;补偿增益恢复失去的响度。掌握这五个,你就可以自信地压缩任何音源。

在典型的混音会话中,压缩是你在 EQ 之后第二个伸手的工具。EQ 塑造音调。压缩塑造感觉——律动、能量、声音的物理冲击力。两者共同构成了你听过的每一个专业混音的基础。

准备好将压缩付诸实践了吗?浏览我们精心策划的免费和付费采样包、鼓包和制作工具。

浏览免费下载

Learning path

Related answer hubs

常见问题

人声的好压缩比率是多少?
3:1 到 4:1 的比率是大多数人声的最佳区间。这在最响的峰值上给你 3-4 dB 的增益压缩,同时保留自然动态。更高的比率(6:1-10:1)只在需要激进效果声音或防止总线削波时才需要。
我应该在 EQ 之前还是之后压缩?
大多数情况下在 EQ 之后压缩——EQ 改变了音调平衡,这改变了哪些频率最响且最可能触发压缩器。在 EQ 之前压缩意味着压缩器对原始信号做出反应,可能导致不可预测的结果。一个例外:当你希望压缩在 EQ 削减之前驯服刺耳的频率时。
我应该使用什么起音时间?
大多数音源从 10-30 ms 开始。更快的起音时间(1-10 ms)抓住瞬态并压平峰值——适合控制人声峰值或粘合鼓组总线。较慢的起音时间(30-100 ms)让瞬态通过,增加冲击感。用你的耳朵:如果鼓的初始击打听起来被压扁了,退后起音。
电表上负增益压缩是什么意思?
增益压缩(GR)总是显示为负数,因为它代表压缩器将信号降低了多少 dB。显示 -6 dB 的 GR 表意味着每当输入超过阈值时,压缩器将输出减少 6 dB。数字越负,发生的压缩越多。
什么是并联压缩,什么时候应该使用?
并联压缩将干(未压缩)信号与重度压缩的副本混合。这在添加压缩的密度和延音的同时保留了原始的自然瞬态。在鼓组、人声或完整混音总线上使用,当你想要两全其美时——冲击感和粘合感,没有被压扁的感觉。