数字音频第五章:Quantitization

6。量化,近似错误和样本量

样本,周期性输入信号的瞬时振幅的快照的ADC,分配数值计算机或数字电路可以使用这一过程被称为量化。可用值可分配的数量取决于的比特数(0和1)用于每个样本,也叫位深度或一些决议。每个额外的一些双打可用值的数量(1比特样品有两个值,2比特样品有4个值,等等)。

最常见的未压缩的数字音频使用脉冲编码调制(PCM)系统,前面提到的。PCM通常指线性PCM或LPCM,尽管它通常只是被称为PCM。在此系统中,如下图所示,振幅层次从低振幅等距的高振幅,即使我们听到对数。对于那些使用“自己动手”数字合成程序像MAX,超级对撞机,Csound,等等,使用线性放大器逐渐变强,他们被称为,减速的感知质量作为他们变得更大,所以它非常普遍使用指数信封。而常见的文件格式AIFF和WAV使用线性PCM编码,像法算法或者是μ-law算法,随振幅的水平。

当一个样本是量子化的,模拟的瞬时快照振幅必须是圆形的向上或向下(或简单地截断在一些系统)最近的可用的数字值。这四舍五入的过程近似。每个示例使用的比特数越小,数值越大距离的模拟值需要四舍五入到最近的数字值。数量之间的差异被称为模拟值和数字值近似误差或量化误差如下面的图解所示的红色和绿色条纹的区域。橙色的酒吧代表量子化的样本值。

3-bit(8)值样本

4比特值(16)样本

左边的图像有8值,相当于3-bit样本大小。右边的图像有16个值,相当于4比特样本大小。注意右边的近似错误是多么的小双的数量值。

更大的近似误差的大小,越大的数字或产生的量化噪声。减少的解决方案数字噪声是使用大样本大小(更大的位深度或精度),也因此对应于系统的动态范围,因为它会影响信噪比。对于数字PCM系统,这通常是衡量SQNR,或signal-to-quantization-noise-ratio这可以在dB的表达。SQNR可以计算类似于振幅deciblesSQNR = 20日志₁₀(2^#的位)≈6.02 * # dB的比特。因此,一般的经验法则:

每多一点/样本容量导致~ 6 dB更大的动态范围。

如果你阅读部分这是有道理的分贝和振幅振幅,即一倍~ 6 dB补充道。每个额外的每样双打可用值的数量,所以结果是平行的。原始CD标准提出的索尼是14-bit样本大小,动态范围只有84分贝,但改变了《盗梦空间》前16位。

正如采样率影响频率响应,样本大小(深度)的影响动态范围,或振幅差异数字噪声地板和最大可能的声音失真。有时它努力充实你的大脑如何影响动态范围可用的二进制值的数量,这是一个极端的例子。你可以看到两种不同的位深度的影响下面的图表,他们每个人都代表了如何成功地高潮由绿色表示模拟波形采样。注意,一比特的样本深度没有任何动态变化(但他们称之为6 dB range-go图)。

出的样品(0或1)

出的样品,没有高潮的代表或增加幅度。声音是在或从,大型低振幅近似误差。它有一个6 dB动态范围。

4比特样本(0000年至1111年)

4比特样品,16个二进制值近似可用高潮更成功,因此有更大的动态范围24分贝。

16位的CD标准样本,以其令人印象深刻的65536量化值,提供了理论回放系统最佳的96分贝动态范围。然而,对于编辑,很多流程创建分数值添加到近似错误,现在是标准程序编辑在24位或更高的分辨率,16777216个值和~ 144分贝动态范围。此外,当我们不断地总结过去,音频质量在未来只会提高,所以保持你的主拷贝在24位或更高版本也推荐工作。

在光谱的另一端,chiptunes鼎盛时期的1980年的游戏音乐,因此故意使用低,8位(48分贝SQNR)样本大小,只有三个音乐和一个噪音的声音,复制的可编程的声音处理器(PSG)发现在视频游戏机和街机游戏。是绝对出色的噪声通道是如何用于打击乐面具数字噪声的语音频道(写或弹奏音谱用于弥补有限数量的声音)。的超级马里奥兄弟的主题不会完全一样的声音在16 -或24位分辨率和无限的复调的声音。

第五章:数字音频

6。量化,近似错误和样本量

每多一点/样本容量导致~ 6 dB更大的动态范围。

出的样品(0或1)

4比特样本(0000年至1111年)