用于通过多个音频输出装置渲染音频的技术的制作方法

各种实施方案整体涉及音频输出装置，并且更具体地涉及通过多个音频输出装置渲染音频。

背景技术：

1、音频通常包括音频对象的混合。例如，电影的配音可能包括一个或多个角色的讲话、来自一个或多个事件的声音效果、来自角色环境的环境噪声以及背景音乐。作为另一示例，音乐可能包括多个组成部分，诸如歌唱、节奏吉他、低音吉他和架子鼓。音频可由麦克风捕获并且实况渲染、记录并随后回放，或者由诸如计算机的装置合成。

2、通常期望通过多个音频输出装置(诸如多组有线或无线扬声器)输出记录的或生成的音频。音频输出装置通常定位在物理空间内的特定位置。例如，在组织为家庭影院的房间中，中央扬声器定位在房间前壁的中心附近，而左前扬声器、右前扬声器、左后扬声器和右后扬声器各自定位在房间的对应角落。诸如电视或计算机的媒体装置可将信号传输到每个扬声器，使得物理空间内的收听者听到所有扬声器的组合输出。

3、在一些情况下，期望将音频输出装置配置为输出空间音频，其中音频对象被收收听者感知为来自物理空间内的特定位置。然而，由多个音频输出装置渲染的音频受到每个音频输出装置与收听者之间的距离的影响。音频在空中在音频输出装置与收听者之间的速度影响收听者感知到的音频的定时，并且强度在空中的衰减影响收听者感知到的音频的音量。此外，在此类情况下，音频的感知方向受到每个音频输出装置与收听者之间的角度的影响。由于这些因素，空间音频的有效性受到音频输出装置在物理空间内的位置的影响。

4、为了应对这些挑战，一些音频系统包括用于调整校准设置的用户界面。例如，音频系统可能允许用户设置或调整每个音频输出装置的音量级别和/或延迟，并且设置的正确组合可能补偿音频输出装置的可变位置。然而，手动校准过程可能很复杂，用户可能会感到困惑或沮丧。用户可能无法确定音频输出装置的特定布置的合适设置，导致音频定位并不比原始或默认设置更好，甚至可能更差。此外，音频输出装置的手动校准设置同样适用于所有音频对象，诸如针对所有音频对象调整每个扬声器的强度和延迟。结果，对于所有音频对象，每个扬声器的输出都被修改，而不管音频对象的不同位置，或者进一步地，不管音频对象的不同轨迹。因此，音频输出装置的这种校准可能导致音频对象的定位不良和/或音频输出装置对于不同音频对象的音频输出不一致。

5、如前所述，需要更有效的技术来通过多个音频输出装置渲染音频。

技术实现思路

1、在各种实施方案中，一种生成音频的计算机实现的方法包括：使多个音频输出装置中的每个音频输出装置输出音频样本；对于所述多个音频输出装置中的每个其他音频输出装置，确定所述其他音频输出装置中包括的两个或更多个麦克风中的每个麦克风对来自每个音频输出装置的所述音频样本的检测时间；基于所述音频输出装置中的每个音频输出装置对所述音频样本中的每个音频样本的检测时间，确定每个音频输出装置相对于所述其他音频输出装置的位置；以及使所述多个音频输出装置中的每个音频输出装置生成与音频对象相关联的音频输出，其中所述音频输出装置中的每个音频输出装置的输出基于所述音频对象的位置和每个音频输出装置相对于所述其他音频输出装置的所述位置。

2、所公开的技术相对于现有技术的至少一个技术优势在于，利用所公开的技术，每个音频输出装置对每个音频对象的输出基于该音频输出装置相对于其他音频输出装置的位置。结果，每个音频对象的定位和/或轨迹由音频输出装置基于它们在物理空间内的位置更准确地渲染。此外，所公开的校准技术可确定每个音频输出装置相对于其他音频输出装置的位置，包括确定两个音频输出装置的位置何时颠倒。此外，与基于用户的校准设置调整相比，所公开的校准技术自动且准确地确定音频输出装置的位置。这些技术优势提供优于现有技术方法的一种或多种技术改进。

技术特征：

1.一种生成音频的计算机实现的方法，所述方法包括：

2.如权利要求1所述的计算机实现的方法，其中确定所述多个音频输出装置中的第一音频输出装置相对于输出所述音频样本的所述音频输出装置的所述位置包括：

3.如权利要求1所述的计算机实现的方法，其中确定所述多个音频输出装置中的第一音频输出装置相对于输出所述音频样本的所述音频输出装置的所述位置包括：

4.如权利要求1所述的计算机实现的方法，其中确定每个音频输出装置相对于所述其他音频输出装置的所述位置包括：

5.如权利要求1所述的计算机实现的方法，其中确定每个音频输出装置相对于所述其他音频输出装置的所述位置包括：

6.如权利要求1所述的计算机实现的方法，其还包括：

7.如权利要求1所述的计算机实现的方法，其还包括基于声学模型确定每个音频输出装置的声学脉冲响应，所述声学模型包括点源声学模型或平面波声学模型中的至少一者。

8.如权利要求1所述的计算机实现的方法，其还包括：

9.如权利要求8所述的计算机实现的方法，其中生成每个音频输出装置的所述音频输出还包括对所述音频对象的音频表示和所述音频输出装置的所述声学脉冲响应应用卷积运算以生成音频输出装置信号，以供所述音频输出装置输出。

10.如权利要求1所述的计算机实现的方法，其还包括：

11.一种非暂时性计算机可读介质，其存储指令，所述指令在由处理器执行时使所述处理器执行以下步骤：

12.如权利要求11所述的非暂时性计算机可读介质，其中确定所述多个音频输出装置中的第一音频输出装置相对于所输出述音频样本的所述音频输出装置的所述位置包括：

13.如权利要求11所述的非暂时性计算机可读介质，其中确定所述多个音频输出装置中的第一音频输出装置相对于所输出述音频样本的所述音频输出装置的所述位置包括：

14.如权利要求11所述的非暂时性计算机可读介质，其中确定每个音频输出装置相对于所述其他音频输出装置的所述位置包括：

15.如权利要求11所述的非暂时性计算机可读介质，其中所述步骤还包括：

16.如权利要求11所述的非暂时性计算机可读介质，其中所述步骤还包括基于声学模型确定每个音频输出装置的声学脉冲响应，所述声学模型包括点源声学模型或平面波声学模型中的至少一者。

17.如权利要求11所述的非暂时性计算机可读介质，其中所述步骤还包括基于每个音频输出装置在第二坐标系统内的位置来确定每个音频输出装置的声学脉冲响应。

18.如权利要求17所述的非暂时性计算机可读介质，其中生成每个音频输出装置的所述音频输出还包括对所述音频对象的音频表示和所述音频输出装置的所述声学脉冲响应应用卷积运算以生成音频输出装置信号，以供所述音频输出装置输出。

19.一种系统，其包括：

20.如权利要求19所述的系统，其中使所述多个音频输出装置中的每个音频输出装置生成所述音频输出还包括：

技术总结
用于生成音频的技术包括：使多个音频输出装置中的每个音频输出装置输出音频样本；对于该多个音频输出装置中的每个其他音频输出装置，确定该其他音频输出装置中包括的两个或更多个麦克风中的每个麦克风对来自每个音频输出装置的该音频样本的检测时间；基于该音频输出装置中的每个音频输出装置对该音频样本中的每个音频样本的检测时间，确定每个音频输出装置相对于该其他音频输出装置的位置；以及使该多个音频输出装置中的每个音频输出装置生成与音频对象相关联的音频输出，其中该音频输出装置中的每个音频输出装置的输出基于该音频对象的位置和每个音频输出装置相对于该其他音频输出装置的该位置。

技术研发人员：郑剑文,周洪飞
受保护的技术使用者：哈曼国际工业有限公司
技术研发日：
技术公布日：2024/12/5

专利

最新回复(0)