家
教学大纲
数字音频,第2部分

数字音频,第2部分

介绍数字音频,第2部分

当将模拟音频信号转换为一个数字表示,一个模数转换器采用振幅测量,或样品在等距的点的波形。采样率——即。,这些测量的频率决定了输入信号的最高频率,可以捕获。在课堂上我们看到,一个不够高采样率造成的损失频率,导致温和或模糊的声音质量。(回顾这些想法,请参阅数字音频,第1部分。)

采样分辨率

采样分辨率指的准确性,而不是频率、振幅的测量。精度越大,越忠诚是一个模拟音频信号的数字表示。精度取决于用于编码的数字振幅测量。大多数转换器使用整数存储这些数据的测量。

考虑一个模拟信号的波形图如下所示。

模拟波形对一个简化的振幅测量网格的整数

灰色的竖线表示时刻我们将模拟信号的振幅的测量,由采样率。灰色的水平线是整数值,可用于表示这些测量。在这个例子中,只有8个整数。当我们测量,我们需要圆滑的真正价值模拟波形到最近的整数。这个过程称为量化。

下面的蓝色恒星是整数测量。由此产生的一系列整数5 6 7 7 5 4 3 1 2 5 7 5 7 4,这是数字计算机商店的流来表示这个波形。

模拟波形和振幅测量一个整数网格

量化误差

这些测量是非常接近的波形值,而另一些则不是。例如,测量下面是完全正确。然而,测量B需要大量的舍入当我们近似真实的模拟值到最近的整数。

模拟波形测量网格显示两个量子化的整数

舍入的数量量化误差。它往往对音频信号的随机分布的复杂性,所以如果你图的误差流音频样本,你会得到一系列的随机数字。每个测量的量化误差是画的底部下面的插图。

子集的网格显示的数量为每个量化舍入误差幅值测量

在数字系统中,当你播放随机数作为音频信号,得到噪声。这噪音被添加到所需的信号的一部分。所以,过多的量化误差产生一个嘈杂的音频信号。由于这个原因,也称为量化误差量化噪声。

增加采样分辨率

战斗量化噪声,你只需要增加一个整数的值的数量可以假设。在数字系统中,整数组二进制数字,代表或碎片。位你分配给一个整数,整数的值就越大。

下面的公式告诉我们如何值一个整数的数量可以取决于可用的比特数来表示整数。

值的数量= 2^N
(其中N是碎片的数量)

所以3位给了我们8可能值,从0到7,而4位给我们16值,从0到15。(如果你想证实了这一点,点击更多关于二进制数按钮的第1页MIDI应用。)

注意,只添加一个双打可用值的数量。在前面的示例中,我们使用3-bit量子化,值从0到7。现在我们添加一个执行4比特量化。这给了我们一个额外的水平整数之间每一对线在上一个示例中,翻倍的分辨率。

4比特量化网格模拟波形叠加相同,显示更少的舍入误差

现在围绕测量几乎不需要任何四舍五入。与3-bit情况下,再次所示。

3-bit量化网格第二上图所示

用来形成一个整数的二进制数是众所周知的位深度或字长。在早期的取样器(1980年代中期),这是共同使用8位样本。虽然这比我们更好的解决上面4比特采样系统,远比16位样本用于cd。事实上,8位添加到每个整数给你256倍的一项决议。所以在16位系统中,额外得到256整数网格线之间的每一对线在一个8位的系统。

使用16位整数给你65536不同值。这些位置通常是对称零,因为这是代表的价值环境空气的压力,或零振幅。所以为16位样本值的范围是在-32768年和32767年之间。

数字波形的振幅范围覆盖全部16位,中心水平线为零

剪裁

如果你想要的真实模拟振幅值来表示需要一个整数值大于32767 ?真不走运,没有办法代表一个值大于16位,所以32767年的值将被截断。(同样的事情也发生在负端值小于-32768。)这就是所谓的剪裁,如果长时间可以严重失真。下图显示了两个模拟波形的地方超过一个16位整数的范围(曲线的虚线部分),导致剪波形(平段在32767和-32768年)后,转换到数字。

最后说明但显示16位振幅网格一样剪波形上下延伸的最大和最小可能值,分别

我们每天使用的声音文件计算机音乐软件通常有单词长度为16和24位。24位音频256倍的分辨率16位音频。这是特别有用,当你的工作幅度很低的声音,如末端长钢琴衰变或混响尾巴。即使信号接近零,仍有足够的分辨率来表示它准确地在不增加太多的量化噪声。

常见的采样分辨率
位深度	使用
8位整数	历史的兴趣只
16位整数	消费音频CD,
24位整数	专业音响
32或64位浮点(整数)	内部表示在软件

未压缩的音频数据速率

未压缩的数字音频,上面所描述的那样,给你非常高的质量。但它可能需要太多的网络带宽来传输慢通过互联网或手机联系。这就是熟悉的MP3格式。

考虑CD音频的示例,它使用16位的样品在一个44100赫兹采样率。有两个平行流,一个为每个通道,产生立体视觉。cd品质的音频的传输速率是什么?

只要你理解所涉及的条款,这是一个简单的数学问题。的两个渠道,每秒44100个样本。这些样品需要16位。传输速率通常描述的比特每秒的数量必须流从源到目的地。在我们的例子中:

44100年样品每秒钟* 16位/样本* 2渠道= 1411.2 kbps
(kbps比特每秒,或数千位/秒)

这工作每分钟大约10 MB(字节)。

有损压缩的音频:MP3, AAC

MP3格式被发明在1990年代中期的减少数据传输和存储的要求未压缩的音频。的压缩用于减少文字处理文件的大小,如邮政、不是很有效的音频。相反,MP3使用知觉编码最小化所需的数据传输和存储音频。这利用了心理声学的原则等屏蔽例如,,响亮的声音很难听到柔和的声音近在频率。而不是一个固定的每个抽样的比特数,在未压缩的音频,MP3压缩比特分配灵活的不同部分的声音。部分的声音需要更大的分辨率得到更多的比特流。部分可能会掩盖了我们的听力得到更少的比特。通过与比特这样,小气的压缩机可以节省大量的存储空间。有不同的数据速率用于MP3文件,这取决于你想要的质量(如128 kbps, 160 kbps, 192 kbps, 256 kbps,等等)。这些都是5到11倍小于未压缩的音频。

问题在于,MP3是一个有损格式。虽然它是基于复杂的假设人类听觉是如何工作的,上面提到的比特分配丢弃信息。当你把一个MP3文件变成未压缩的音频,比如当你玩它,一些原始的声音数据是一去不复返了。MP3是一份好工作,但对音频质量非常敏感的人,并监听的专业设备,能听到压缩的工件。

AAC格式(.m4v)是最近的损耗比MP3格式,达到更好的音质相同数量的存储空间。AAC是可用的格式在苹果音乐之一。