第四章:合成

11。卷积:cross-synthesis的一种形式

Cross-synthesis是一种技术,通过该技术的一个信号授予一个或多个特征到另一个。卷积是cross-synthesis的方法,结合两个音频来源以这样一种方式,在频域中,这些频率的共同点将强调比例,和那些他们不共享将最小化。在时域,那些频率,闲逛的方式涂抹,消失是另一个卷积过程的一部分。有限的来源可能都是数字音频文件长度,或一个有限的文件和其他实时输入(潜在的无限)。卷积是现在通常用于高质量的混音(称为卷积混响——莫土语表现数字卷积混响插件谚语),过滤和给一个特定的声音文件的某些特征,另一个(例如说崩溃钹,)。卷积修改的声音频域时间域。两个固定文件的卷积输出时间(使用正统的计算方法)的总持续时间的总持续时间添加到另一个- 1样本。对卷积混响,输出声音将环或声音结束过去的输入信号为脉冲长度的文件- 1样本。

当讨论卷积理论,信号来源之一是通常被称为输入信号(是)和其他单位脉冲或脉冲响应(IR)文件。信号输入(是)可能是有限的一组音频样本(即预先录制好的数字音频)或一个潜在的无限的音频信号从寒鸦跟踪或麦克风。脉冲响应(IR)文件几乎总是一个固定长度,并改变它在卷积创建不必要的故障大多数处理技术(试试改变脉冲响应长度参数在玩一个文件通过它表现在数字确认)。冲动的文件可能只是另一个音频文件等于进口的,在这种情况下,我们会考虑这个cross-synthesis,或者它可能是一个真正的脉冲响应文件,通过下面描述的方法创建。

真正的脉冲响应(IR)文件代表一个声学空间的特点-实际的声音用来确定这些特征。通常很短的正弦扫描文件称为信号和/或短和夏普参考声音叫做脉冲(可以从起动器的手枪或一个水球)被设置在一个房间里,音乐厅,花盆,啤酒可以一个希望模型或任何空间。由此产生的声音,包括频率反射和混响(光谱响应)是记录下一个特殊的参考麦克风或多个麦克风。然后的原始冲动枪或气球,等等,从产生的声音文件删除,剩下的是脉冲响应(IR)的空间,发挥中间IR文件下面听听红外听起来像一个典型的房间。等混响包Altiverb或逻辑专业有自己的内置红外创造能力。看一个有趣的视频为Altiverb IR的创建在这里,下载链接清洁工和冲动。

任何干燥的声音与红外将卷积声音就好像它是在红外空间执行。举个例子,如果你有阿姆斯特丹的红外Concertgebouw音乐厅大厅(我)你可以与你的狗的狗叫和卷积得到的结果这个著名的舞台上你的狗叫声,进一步双关语是取决于你。注意,“干”的狗树皮文件2秒长,IR文件4秒长,由此而来的文件,卷积的混响长约6秒死,这是一个从下面的数学期望。

下面的图表展示了这些关系。

狗树皮干 音乐厅红外 合成卷积文件(Concertgebowwow)

然而,如果我们采取同样的狗树皮输入和卷积的红外花盆,我们得到一个不同的输出结果。也更短,因为花盆基本上没有reverberance,因此短红外。

下面的图表展示了这些关系。

狗树皮干 花盆红外 卷积结果文件

互联网充满了免费的脉冲响应文件,尽管其中许多质量问题。许多法要么质量康沃变频器混音和国税局,或一个可以购买康沃变频器与质量国税局混响插件。此外,虽然你可能得到一个很好的红外,记住这只是一个地方在大厅里,在舞台上或者观众,通常依赖于所使用的测量设备,与大厅和舞台空而不是挤满了人,等等。一个很大的收集国税局从一个大厅在芬兰,与证据确凿的测量可以找到的细节在这里。高质量的康沃变频器混响开发者和某些大厅像卡内基音乐厅警卫队国税局仔细。

理论和实践

理论

数字信号处理的讨论数学经常使用以下约定:

音频文件中引用一个特定样本,样本可以直接由其位置将[n]。F [n]表明文件的第n个样本值F F[0]表明时间0和/或第一个示例。此外,N是用于指示文件中的样品总数(从样品开始# 0)。

卷积,实际的数学基础直接的卷积很少使用的实用音频实现。所需的计算太耗时,但最短的所有文件和下面列出的有更有效的方法。卷积是一个修改数学求和过程,使用矩阵数学。如果我们把下半年的输入信号(是)文件和一个1示例脉冲响应(IR),公式是:

输出[n] = [n] *红外[0]n = 0, 1, 2, 3N . .

如果假设样本值的输入信号(是)3 4 1 2和红外的单值是2,输出文件是3 * 2,4 * 2,1 * 2,2 * 2,或6 8 2 4。在这种情况下,脉冲响应文件就只是一个振幅比例因子和振幅的样品我们只翻了一番,没有改变任何光谱或时域特征。

然而,当有多个样品在红外文件中,数学过程的问题。有许多来源(我强烈建议柯蒂斯道路:电脑音乐教程),您将看到两个有限文件的具体直接的卷积公式。然而,如果小量的或积分吓唬你,这是一个口头的一步一步的描述直接卷积过程两个文件是不同长度的和IR。

3 = 2 4 6 IR = 1 2 3 4 5

步骤1:红外的每一个价值乘以SI[0](或2),结果写出来的一条线。你应该得到:

2 10 4 6 8

步骤2:最重要的是,跳过在一个地方,每个IR的价值乘以SI[1](或4),应该给你:

4 20. 8 12 16
2 10 4 6 8

步骤3:继续这个过程,直到所有的SI值已经筋疲力尽,应该给你:

6 30. 12 18 24
3 15 6 9 12
4 20. 8 12 16
2 10 4 6 8

步骤4:最后,垂直列求和得到最终的输出样本。

2 14 27 35 56 37 30. 24

注意,输出文件的振幅范围值远高于输入信号或IR值,乘法和加法的一个预期的结果。它是一个标准的实践与所谓的卷积过程结束post-normalization,输出文件是乘以一个比例因子减少到保持样本值的范围。卷积最好也用浮点值,当更多的值可用pre-normalized输出之前减少到16 -通过post-normalization或24位数字。实时卷积,不知道可能产生的最大振幅,控制输入和输出水平的卷积混响变得非常重要,因为它们容易超载和剪辑。

Excel电子表格计算的输出和IR值(8)在这里。对于较短的文件,使用0或离开细胞空白。

实践

在实践中,通常是通过卷积计算FFT或两输入和红外光谱分析文件,并一起乘他们的光谱。这就是所谓的快速卷积并保存数量级的计算机操作,由于FFT和DFT的效率柯蒂斯道路电脑音乐教程(p . 424)状态两个波形的卷积等于光谱的乘法。也逆是真的,乘两个波形,如上面我们直接卷积等于谱的卷积。FFT算法的美,在我前一章提到的,是每个文件窗口的成帧的512年,1024年,2048个样本等等,所以更大的块可以有效地由FFT分析。这个过程是相对简单的。首先,每个文件,与零和IR是“在”,被添加到结束,直到他们达到+ IR 1的长度。然后,每个帧的频谱乘以相应的红外框的频谱。的输出是由传输线,vocoding或逆FFT,类似的阶段。

从技术上讲,这是卷积的冰山一角,因为有许多变异的方法取决于信号的相对长度和所需的速度处理。你可以调查等方面循环卷积(最常用的快速卷积算法)overlap-save重叠块的方法交叠相加卷积的方法重叠块的输出。每个重叠因子的1/5,所以对于1024块,大小约200样品将由下一帧重叠。请注意,尽管这些都是非常有趣的,尤其是如果你的数学是强大的,他们不是必不可少的好创意利用卷积,我们使用的软件工具已经把这些方法之一,尽管一些,比如SoundHack,给你一些选择如何充分实现。

至少这篇文章的时候,是不可能的输出文件和卷积deconvolve成其组成输入文件不知道的结构组件的至少一个文件或能够估计。如果是这样,我们中的许多人会激动我们能清除多余的混响overly-ambient录音。一些信号,如噪音或哼,可以大致估计,移除它们的反褶积过程可通过商业软件。一些盲反褶积使用统计分析完成,特别是因为它关系到鸡尾酒会效应

Baidu
map