我们刚刚发布了具有更高信噪比的 SKR0600,可实现更灵活的集成!

音频集线器

紫蓝波浪背景

音频集线器

评估语音质量和降噪效果

评估语音质量和去除背景噪音

作者:杰弗里-莱希
2023-07-17

通过去除背景噪音评估语音质量

您是否想过公司是如何评估其麦克风在嘈杂环境中的语音质量的?这些测试在去除背景噪声后效果如何?评估语音质量,特别是在有背景噪声的情况下,是一个比表面看起来更复杂的过程。音频处理算法,如波束成形、压缩、降噪和自动增益控制,都是用来消除不必要的噪音。但需要注意的是,这些方法也会在录音中引入不想要的人工痕迹和失真。本文将介绍各种评估方法,并强调这些测试对麦克风的重要意义。

各种背景噪音,去除背景噪音即可解决。

当说话声伴有背景噪音时,要清楚地理解说话内容就会面临相当大的挑战。有时,噪音会让人喘不过气来,以至于难以理解所传达的信息。如果我们使用过于激进的算法来去除背景噪音,可能会无意中改变语音,导致语音听起来像机器人的语调。如果背景噪音本身就是语音,例如繁忙餐厅中的对话,那么这项任务就会变得更加艰巨。

在咖啡厅使用背景噪声去除技术

此外,我们的大脑习惯于在嘈杂的环境中交流,这意味着当噪音水平较高时,我们对语音假象的容忍度更高。然而,当噪音水平很低时,我们自然会期望语音质量更高、更清晰。从本质上讲,我们的目标是以极高的清晰度和精确度捕捉预定的语音,同时有效地降低或最大限度地减少背景噪声的影响。

音频质量评级

传统上,评估音频或语音质量的方法是由专家小组聆听录音,并按 1 到 5 的评分标准进行评分,1 代表 "差",5 代表 "优"。然后计算出平均意见分 (MOS),作为不同专家打分的平均值。然而,这种方法成本高昂,设置耗时。它需要选择和协调一个由训练有素的专家组成的小组,这些专家需要进行多次会议,对各种原型迭代或算法版本进行评分,以确定最佳解决方案,并与现有产品进行比较。

去除背景噪音后的音频质量评级。

为了简化这一过程并使其更易于使用,人们开发了几种模型来自动进行专家的 MOS 评级。其中一个由 HEAD Acoustics 公司开发的模型名为3QUEST,主要针对嘈杂环境下的语音质量评级。其设置包括录制被测设备,同时通过头部和躯干模拟器(HATS)或口腔模拟器播放语音。此外,还通过设备周围战略性布置的四至八个扬声器播放噪声模拟。具体选择哪种噪声模拟场景取决于所测试的产品类别,例如使用呼叫中心噪声评估耳机,或使用汽车发动机噪声评估汽车免提麦克风。

3Quest 的测量设置。
图 1:3Quest 的测量装置。

然后使用 HEAD Acoustic 的 3QUEST 软件对录制的音频进行评估,将其与干净的原始语音文件进行比较。该软件可评估噪音和语音的各种特性,包括电平、失真等。它会生成三个分数:N-MOS代表噪音质量,S-MOS代表语音质量,G-MOS是全局分数。如前所述,当背景噪音较少时,我们预计语音质量会更高。因此,S-MOS 将 N-MOS 作为其输入变量之一。G-MOS 是 N-MOS 和 S-MOS 的加权组合。某些背景噪音去除服务和选项会显著降低整体语音质量,导致 G-MOS 分数降低。不过,随着技术的进步,例如Soundskrit 的定向 MEMS 麦克风,更新的产品将能够在不明显影响整体音质的情况下去除背景噪声。

有了 3QUEST 这样的工具,就能更容易地比较不同音频解决方案在嘈杂环境中的语音性能。此外,如果使用得当,该工具还能进行实验室间的比较,从而改进评估过程。

总之,公司依靠 3Quest 软件等先进工具来评估嘈杂环境中的语音质量,并衡量麦克风的性能。这项综合测试为三个关键因素提供了宝贵的见解:N-MOS、S-MOS 和 G-MOS,为在嘈杂环境中开发最佳麦克风提供指导。随着背景噪声消除技术的进步,音质将不再受到影响。有关音频的更多详情,请访问我们的网页 音频集线器.

参考资料

  • HEAD Acoustic 3QUEST: https://cdn.head-acoustics.com/fileadmin/data/global/Application-Notes/Telecom/3QUEST-Application-Note.pdf