第五章:数字音频

8。数字音频文件格式| 2页

许多文件格式是最初设计使用一个特定的处理器芯片。例如,AIFF格式设计680年摩托罗拉x0-based苹果Macintosh,使用大端字节顺序),但后来取代AIFC与英特尔芯片的出现,这是低位优先的字节顺序编码的音频,而不是其他的文件信息。微软WAV或波格式为英特尔80 x86处理器,设计的LSB在先(大端)。大多数高分辨率文件格式现在bi-endian,这是伟大的,因为它真的让人费解跟踪格式变化和发展,它允许尽可能跨平台的文件格式。

音频文件有两个主要功能相关的术语。第一个是编解码器或者实际需要音频编码和解码。例如,我们在早些时候提到的线性PCM编码量化部分。第二个指定一个文件是它的容器格式,就像你把你的火腿三明治的包装器。无论是塑料包装,或密封塑料袋,它仍然包含你的火腿三明治。容器,如波、mp3或FLAC不仅包含编码的音频数据,而且元数据指定从音频编码的类型,文件长度、样本或比特率,endianess,压缩方案和深度等。一些容器只接受一定的编解码器,如AIFF,只接受未压缩线性PCM,而另一些人则接受各种各样的编解码器。例如,AIFF的妹妹AIFC接受两个未压缩的线性PCM格式压缩音频如我们前面提到的μ-law编码。

你可能会遇到第三个术语在处理网络音频和web浏览器,这是一个媒体类型(原MIME类型),比如音频/ mpeg可以让浏览器知道如何复制的文件类型和内容,必要时呼吁一个安装辅助应用。如果浏览器不能播放一个特定类型的音频文件,您可能需要在您的浏览器中添加MIME类型的,或者您的浏览器可能不支持MIME类型。

最下面的格式,来自视频游戏公司电子艺界85 EA文件交换格式的概念,结构,每个包含一个头卡盘与以下信息,如块ID (ckID),遵循描述方面的数据(例如,数量的渠道,采样率,endianess,压缩方案,等等),块大小(ckSize),最后一部分数据本身,可实际的音频样本或其他类型的数据。一些容器将ckID和ckSize,甚至把去年(参见下面的.caf)大小。一个IFF-style文件可以包含多个块。如果一块不需要一个特定的使用,它可以跳过和忽视。的ID3v2标签块,例如,经常发现在mp3文件,可能广泛的关于音乐的信息列表标题,表演者,等出现在iTunes或流在你的汽车音响,每分钟跳动,但也可以跳过。通讯的AIFC文件包含一个条目(评论)块描述是否有压缩,和什么类型的压缩。

最后,可以分类为文件类型无损压缩,无损压缩,或有损压缩(“糟糕的压缩”的同义词在低比特率)。再次强调,保持你的主副本未压缩格式,然后转换到有损格式。试一试从一个有损格式转换到另一个,这进一步降低了质量,但重新开始从你的未压缩的副本。下面是最常见的一个图表每个在当前使用的2020年,但为进一步的细节,这是一个优秀的文章在不同的编解码器。

最常见的音频文件类型电子工作室
无损压缩 AIFF
无损压缩 FLAC ALAC
有损压缩 AAC格式 MP3

基于知觉音频压缩

视频游戏和计算机图形学程序一直节省计算开销不计算部分的一个场景视图屏幕。为了节省内存空间,或者更快的共享网络上的文件传输,等工程师开发类似的策略来消除部分的数字音频信息不会被认为基于心理声学的原理,主要是掩蔽现象讨论的声学一章。MP3编码算法,是在1980年代末开发可以提供可接受的音频质量(对于那些更关心空间/速度比质量)压缩节省约为10:1;10 Mb未压缩的44.1 kHz文件可能是1 Mb的MP3文件在128 kbps(千比特/秒)。此外,格式允许可变比特率(VBR)除了恒定比特率(CBR),所以更多的信息可以被包括在需要的地方,和更少的时候。AAC是最近的知觉编码格式和一个更好的工作。它是默认对大多数手机、游戏机等,在撰写本文时。作曲家是压缩格式丢弃信息的重要性永远无法从压缩文件中检索,因此(一次),不掌握你的音乐压缩格式。对于一个优秀的,更详细的编码过程的描述,探索这一页

一些常见的声音文件格式类型。xxx表示常见的文件名扩展用于这些格式):

  • aif.aiffAIFF(音频文件交换格式),16位的黄金标准未压缩的PCM音频、旅行以及之间的几乎所有的计算机和软件,包括头信息,如文件名称、采样率、MIDI注意数字采样,循环点,在文件的字节数。它是由苹果公司的基础敌我识别的格式,现在bi-endian AIFC添加。也能够24位,甚至32位和64位的决议,但4 g的文件大小限制。有能力在理论上包含无限数量的渠道。在许多情况下,文件像AIFF文件实际上是AIFC-formatted,尽管他们可能运动aif或.aiff文件扩展名。点击这里原来的规格。

  • .aifcAIFCAIFF-C(可能AIFF-does没有被压缩的压缩版本,支持低位优先PCM音频数据使用AIFC / sowt(向后“2”)计划,尽管头数据仍然使用AIFF大端格式。一些老AIFF-happy项目将对AIFC窒息,特别是音频压缩。点击这里从苹果电脑为pdf格式规范草案。

  • . wav微软波(专为个人电脑和Windows,但现在大多数音频程序可用,Mac电脑或其他)。类似于AIFF位深度和样本率。正如上面提到的,它使用MSB和LSB的倒序AIFF文件,所以微软开发的即兴重复文件交换格式来支持“低位优先”的计划。AIFF一样,一个4 gb的文件大小限制。

  • .m4a .aac或AAC格式,或高级音频编码方案由索尼(Sony)、丙氨酸,杜比实验室,和原来的MP3,这可能编码压缩(有损)多渠道5.1环绕文件,以及其他mono、音响其他大规模的多渠道格式在低比特率或96 kbps, 24位分辨率。这是常用的压缩视频文件的web。AAC绕过mp3的局限性是NBC (non-backward兼容),尽管它是基于mpeg - 2标准,认为声音比mp3的类似的比特率。新AAC mpeg - 4编码进一步增加了质量在低比特率实际上似乎AACmpeg - 4的音频标准,因此,m4a格式扩展。点击这里为进一步的信息。

  • mp3(MPEG压缩I-audio第三层)——1987年,弗劳恩霍夫IIS-A开始工作感知音频编码框架的尤里卡计划。联合合作埃朗根大学的弗劳恩霍夫IIS-A最后设计了一个非常强大的算法,是标准化ISO-MPEG音频第三层。与适当的编解码器,可以实现压缩率高达24倍附近——(但不包括)cd性质。MP3的美妙之处在于它的大小与感知质量,还能够下载,然后加载到手机和MP3播放器的闪存。也可以流到MP3客户端软件,大多数Web浏览器识别音频辅助应用程序。文件编码在特定比特率为目标的下载速度;例如,非常好的质量可以达到160至192 kbps的编码,甚至更好的320 kbps。MP3-no要掌握你的音乐,但至少你可以听它当你慢跑。

  • . ogg(Ogg,有时被称为/ Ogg Vorbis Vorbis可变比特率编码,它现在已经被取代,作品编码)。这是有损的,open-patent格式,支持音乐、视频和文本,这使得它适合在线多媒体内容。是推荐后备HTML5 web使用mp3音频格式或其他一线格式。首先由Xiph创建于1993年。Org的基础。

  • 一些遗留或少常用格式:

  • .sd2SD二世(声音设计师II-same AIFF专有信息,如添加标记和区域)。开发了Digidesign声音加速器二世在1985年DSP卡片编辑样本。在长期使用专业工具和数字演员和仍然可以打开的。不总是便携式non-Mac电脑。

  • .caf核心音频格式由苹果和出版在这里。像其他几个格式,CAF是许多不同种类的包装器编码,从高分辨率压缩。苹果热情地告诉我们,不像AIFF, AIFC波,CAF使用64位的偏移量,允许无限制的文件大小(“…数百年的声音”),CAF附加其文件大小的文件,所以不需要重写头当记录/编辑和潜在的软管文件如果发生错误而写新的大小头。如果你曾经安装苹果GarageBand或逻辑在你的Mac Pro,有可能你会发现整个图书馆CAF示例文件在/图书馆/音频/苹果循环。

  • .ra.ram(真正的音频,以前所有的一切在网络音频、需要RealAudio应用或客户机插件…在2020年他们仍然在商业,但音频流转移到更好的选择)——将流从一个真正的音频服务器在互联网上,所以声音开始玩之前文件完全下载。他们在多个编码抽样率,以适应不同的用户下载速度(DSL调制解调器(那是什么?),T1线路,等等),包括8 kbps 1.5 Mbps(不要试着在你的祖母的28.8调制解调器)1.5 Mbps。也可以结合视频真实的流媒体。息差压缩工件整个频谱理论上是不明显的。见www.real.com。现在非常遗留格式。

  • 的WMAWindows媒体音频包括专用编解码器设计用于与视窗媒体播放器不同压缩比达到无损的WMA Pro,支持768 kbps。需要专用播放器,如Winamp。

  • .au(网络,仍然使用电话,以前太阳计算机或爱恋使用下的)。非线性采样使用压缩,的带宽是有限的低采样率和安培的非线性编码高振幅要求更少的价值。爱恋(SND)文件,用于下一个电脑,在本质上是.au文件,通常被称为下一个/太阳(au)格式。

  • .ul或μ-law (mu-law,明显myew-law)我们电话,headerless,通常是8位,通常低质量)。类似的方法与非线性编码,网络带宽有限和压缩。

  • . sf(IRCAM de矫揉造作的研究所等协调Acoustique /音乐节在巴黎)。是IRCAM的专有软件开发的,那么可怕的微型计算机的时间如太阳、VAX, MIPS (Dec),下一个数据类型和endianess住宿。我们不建议你提交你的下一个会议在这种格式。IRCAM还开发了SDIF(声音数据交换格式)连同CNMAT,这是今天仍在使用用于各种目的,如共振建模编码。

有很多很多更多的声音格式目前使用,许多进入存在和那些垃圾箱。一个Web搜索音频编解码器和音频文件格式会取得许多成果。

大多数音频程序和法将现有的文件保存在交替格式,称为代码转换,交叉或作为单独的mono文件,包括数字表演者,逻辑,音频处理和Adobe媒体编码器等。以下是一些很多选择音频处理的代码转换音频文件用“另存为…”

此外,实用程序来创建、编辑或修改文件的标题可以是非常有用的。一个神奇的和免费的(感谢汤姆)计划,由汤姆Erbe SoundHack声音文件格式转换,更可以找到在这里(卡特琳娜64位现在正在更新)。

Baidu
map