西数司法鉴定中心
在语音同一性判断中,第三、第四共振峰(F3、F4)并非绝对比第一、第二共振峰(F1、F2)“更有价值”,而是三者价值定位不同 ——F1、F2 是判断的 “基础核心”,F3、F4 是 “关键补充”,需结合场景分工协作,不存在绝对的优先级高低。
语音共振峰的价值取决于其 “区分语音特征的特异性”,F1/F2 和 F3/F4 在不同维度的作用截然不同:
F1 和 F2 直接对应元音的核心特征,是语音同一性判断的 “入门级关键”,理由如下:
直接关联元音音色:F1 主要反映舌位高低(舌位越低,F1 频率越高,如 “a” 的 F1 高于 “i”),F2 主要反映舌位前后(舌位越靠前,F2 频率越高,如 “i” 的 F2 高于 “u”);两者结合能直接区分绝大多数元音(如 “a、o、e、i、u”),是判断 “是否为同一人基础发音习惯” 的核心依据。
稳定性高且易提取:F1、F2 的频率范围相对固定(F1 约 200-800Hz,F2 约 800-2500Hz),受发音环境(如语速、情绪)影响较小,且在语音信号中能量较强,容易通过频谱图精准提取,是判断的 “基础锚点”。
F3、F4 的价值体现在 “突破 F1/F2 的区分局限”,尤其在关键场景中不可或缺:
区分相似元音与辅音:当 F1、F2 差异极小时(如 “i” 和 “ü”、“zh” 和 “ch”),F3 的细微差异成为核心区分点 —— 例如普通话中 “卷舌音(zh/ch/sh)” 的 F3 频率比 “平舌音(z/c/s)” 低约 200-300Hz,仅靠 F1/F2 无法区分;部分方言中 “前鼻韵” 与 “后鼻韵” 的差异也依赖 F3 的变化。
凸显个人发音 “特异性”:F3、F4 与声带振动模式、咽腔形状(如鼻腔共鸣、口腔开合度的细微习惯)直接相关,而这些特征具有更强的 “个人唯一性”—— 比如两人发同一元音时,F1、F2 可能因发音标准度接近而重合,但 F3、F4 会因天生咽腔结构、长期发音习惯的差异呈现明显区别,是 “排除相似发音、锁定唯一说话人” 的关键。
抗干扰性更强:在嘈杂环境(如背景噪音、录音设备失真)中,F1、F2 可能因低频干扰出现偏差,而 F3、F4 频率更高(F3 约 2500-4000Hz,F4 约 3500-5000Hz),受低频噪音影响更小,能在复杂场景中保持稳定性,辅助验证同一性。
F3、F4 的 “补充价值” 在特定场景下会转化为 “核心需求”,此时其重要性会超过 F1/F2 的基础作用:
相似发音人的区分:当两名说话人音色、元音发音习惯高度相似(如亲属、长期共同生活的人),F1、F2 差异极小,此时 F3、F4 的细微频率差成为判断 “是否为同一人” 的核心依据。
辅音与特殊音素判断:涉及卷舌音、鼻音、边音等辅音,或方言中特殊元音(如粤语的 “œ”、吴语的 “ɪ”)时,F1、F2 无法覆盖区分需求,必须依赖 F3、F4 的特征。
司法语音鉴定等高精度场景:在法庭证据、声纹比对等需要 “100% 排除非同一人” 的场景中,仅靠 F1、F2 的基础匹配不足以形成铁证,需 F3、F4 的特异性特征作为 “佐证”,确保判断的严谨性。
两者本质是 “基础 + 进阶” 的协作关系,而非 “谁比谁更有价值”,完整的语音同一性判断必须同时结合 F1-F4 的特征,再辅助以基频(F0)、音长、节奏等其他语音参数,才能实现精准判断。