在工业检测中,传统依赖声压级(Sound Pressure Level, SPL)或单一振动幅度的方法,往往只能识别幅度较大、持续明显的异常,却难以对短时、轻微或掩藏在复杂噪声背景下的细微异常保持敏感。所谓“声纹潜能”,正是指蕴藏在声学与振动信号中的深层信息,这些隐藏参数并不能通过分贝数直接呈现,而是记录着设备运行状态、结构微小变化或潜在故障的蛛丝马迹。通过提取与分析响度(Loudness)、尖锐度(Sharpness)、粗糙度(Roughness)等声品质参数,可以将这些难以察觉但极具价值的特征“放大”,使得正常与异常工况之间的细节差异更加清晰。依托这种声纹潜能,检测模型突破了传统分贝或幅值判定的局限,能够捕获那些被掩盖、易被忽略的异常,实现更高精度与更强鲁棒性的智能化故障诊断。
一、从声压级看声音的物理强度与感知基础
声压级是衡量声音强度的基本物理量,通常以分贝(dB)表示。它的计算基于声压与参考声压(一般取,即人耳在1 kHz 处的听阈声压)之间的对数比值,公式为:
,其中
表示测得的有效声压值(通常为均方根声压,RMS)。这一对数形式能够压缩声压的巨大动态范围,使之更符合人耳的听觉感知特性。
SPL反映了声波作用在空气介质上的压力大小,是声音工程中最直观、可量化的指标。然而,仅仅依赖声压级并不能全面描述声音的感知效果,因为人耳对不同频率和调制模式的声音敏感度不同。例如,同样的 SPL 在高频下可能听起来更刺耳,而在低频下可能更浑厚。因此,声压级更多体现的是声音的“物理大小”,而非“听起来的舒适度或刺耳感”。在工业设计和产品开发中,声压级为声学测量提供了最基础的数据,同时也为进一步分析响度、尖锐度、粗糙度等心理声学参数奠定了基础,从而帮助工程师在保证定量可控的前提下,优化用户的主观听觉体验。
二、从“声压强度”到“声品质体验”
在工程检测中,人们通常采用声压级(Sound Pressure Level,SPL,以分贝 dB 表示)来表征声音的强弱。然而,将分贝数值直接等同于声音体验是一种片面的理解。声压级体现的只是声音的“物理大小”,但并不能反映声音给人的主观感受。SPL属于客观的物理测量指标,而声品质则更强调人耳对声音的心理认知,它综合了频谱特征、时间变化、调制形式以及听觉系统的生理反应等因素。换句话说,声压级回答的是“声音有多响?”,而声品质关注的是“这种声音听起来让人感觉如何?”。
三、心理学声品质参数
为了将人的主观听觉感受转化为可量化、可优化的工程指标,声学工程师常常借助心理声学(Psychoacoustics)提出的一系列客观参数来描述声音特性。这些指标弥补了单一声压级(dB)的不足,使评价结果更接近真实的听觉体验。其中最典型的参数之一是响度(Loudness),它反映了人耳对不同频率和强度声音的感知强弱,而不仅仅是物理声压大小。除此之外,尖锐度(Sharpness) 用于刻画声音在高频成分占比高时带来的刺耳感;粗糙度(Roughness) 则对应于低频调制或不规则波动造成的颤动和不稳定感。通过这些参数的综合表征,可以在客观物理量与主观听觉感受之间建立桥梁,从而为工业设计、产品优化和声品质评价提供科学依据
- 响度 (Loudness)
- 定义:响度是人耳对声音强弱的主观感知量,它不仅依赖于声压级(SPL)的物理大小,还与声音的频谱分布、人耳的临界带特性、持续时间及调制形式密切相关。换句话说,即使两个声音具有相同的声压级,如果一个集中在耳朵最敏感的中高频区域(约 1–5 kHz),其响度也会显著高于低频或平稳噪声。响度因而比单纯的 SPL 更能真实反映“听起来有多响。
原理:
响度的研究基于心理声学中的等响曲线,该曲线反映了人耳在不同频率下的敏感度差异。国际标准 ISO 532 给出了响度的计算方法,包括 Zwicker 模型和 Stevens 模型。其中,Zwicker 响度模型通过临界带分析信号在不同频带的能量分布,并结合听觉掩蔽效应与响度加和规律,得到总体响度。
人耳对不同频率的声音敏感度并不均衡,等响曲线显示在 3~4 kHz 附近最为敏感,而低频和高频则需要更高声压才能达到同样响度感受;此外,人耳对宽带噪声的感知强度通常高于多个单音的简单叠加,这种掩蔽效应使得声音的频谱分布显著影响主观响度;声音的持续时间也会影响感知短时、瞬态声音通常听起来比长声更轻。综合这些特性,响度不仅取决于声压大小,更与频率、带宽和时间特性密切相关。
- 举例
两辆车的发动机声压可能相同(如70 dB SPL),但由于频谱分布不同,高频尖锐声或中频调制成分会显著增加主观响度。经过NVH 优化的车型通过抑制高频刺耳声和调整低频轰鸣,使驾驶舱内的响度感知降低,提升驾驶舒适性。
2.尖锐度(Sharpness)
- 定义:尖锐度是人耳对声音中高频成分的主观感知,直接反映声音的“刺耳”或“尖利”程度。与声压级不同,尖锐度关注的是频谱分布特性,而非整体强度。
- 原理:
尖锐度的产生主要源于人耳听觉系统对高频声音的敏感度增强。人耳的外耳道和中耳结构对 2–5 kHz 范围内的频率具有自然共振放大作用,这使得高频声音更容易引起强烈的听觉刺激。此外,高频声波波长较短,在空气中衰减较快,但一旦在声源中占据主导,就会在人耳中形成强烈的“刺耳感”。
心理声学研究表明,尖锐度不仅与高频能量占比有关,还与能量分布的“偏心性”相关,即频谱重心向高频偏移得越多,主观感受到的尖锐度越强。
- 举例
电动车风机运转会产生必要的高频噪声,但设计合理的叶片、风道和隔振结构可降低高频尖锐成分,即便总声压相同,也能让车内乘客感觉舒适。
3.粗糙度 (Roughness)
- 定义:粗糙度衡量声音的调制特征,即声音在短时间内的快速波动,听感上类似于“嘎啦嘎啦”“突突突”的颗粒感或颤动感
- 原理:
粗糙感的产生与人耳的临界带机制密切相关。当信号在一个临界带宽内存在幅度或频率的快速调制时,会导致听觉神经纤维的放电率出现周期性波动。这种神经放电的波动落在 15–300 Hz 范围内时,人耳最为敏感,主观感受到的粗糙度最强。
如果调制频率低于15 Hz,人耳更倾向于感知为“颤动”;
如果调制频率高于300 Hz,则波动过快,人耳会将其“平均化”,粗糙感减弱。
因此,粗糙度实际上体现了声音的“短时不平滑性”。例如:发动机的金属摩擦声、风扇的抖动噪声,往往表现为高粗糙度;而均匀的低频轰鸣声,则粗糙度较低
- 举例
高端洗碗机在高转速清洗或冲洗阶段,如果内部碗碟摆放不均或泵浦运转不平稳,会产生快速的振动波动声,高粗糙度让用户感觉机械不稳定。通过优化泵浦控制、滚筒平衡和减震结构,可显著降低粗糙度。
四、总结
声音不仅是物理现象,更是一种与环境对话的“感官语言”,它承载着用户对产品性能与品质的第一感知。在当代设计中,单纯追求分贝数的降低已难以满足用户对高品质体验的需求。真正的声学优化,应当深入到声音的细节层面,聚焦那些隐藏在频谱纹理与微观振动中的特征,通过科学的测量与工程调控,将这些不可见却可感知的声学元素转化为舒适、自然且富有辨识度的听觉体验,从而赋予产品独特的声音特征与竞争优势。
参考文献
[1]Alonso, O. (2015). Challenges with Label Quality for Supervised Learning. Journal of Data and Information Quality (JDIQ), 6(1).
[2]Zwicker, E., & Fastl, H. (1999). Psychoacoustics: Facts and Models. Springer.
[3]ISO 532-1:2017. Acoustics — Methods for calculating loudness — Part 1: Zwicker method.
[4]ISO 532-2:2017. Acoustics — Methods for calculating loudness — Part 2: Stevens’ method.
[5] DIN 45692:2009-02. Acoustics — Calculation of sharpness.