操作 1:双击打开 Praat 软件,界面分为左右两栏(左栏 “List of Objects”,右栏 “Praat Scripts”)。
▶ 截图描述:左栏空白,右栏显示 “New Praat Script” 等按钮,顶部菜单栏有 “Open”“File” 等选项。
操作 2:点击顶部菜单栏「Open」→「Read from file」,在弹出的文件窗口中,选择待分析的 WAV 格式语音文件(若只有 MP3,需先用 Audacity 转成 WAV),点击 “打开”。
▶ 截图描述:左栏 “List of Objects” 中出现 “Sound XXX”(XXX 为文件名),表示导入成功。
操作 1:在左栏选中 “Sound XXX”,点击右侧「View & Edit」按钮,弹出新的编辑窗口。
▶ 截图描述:编辑窗口上半部分是 “波形图”(蓝色波形,静音段接近水平,元音段波形规律起伏),下半部分是 “频谱图”(深色背景,亮色横线为共振峰轨迹)。
操作 2:拖动鼠标在波形图上选中 完整元音片段(如 “a” 的发音):找波形 “平稳且连续起伏” 的部分,避开开头的辅音(如 “b” 的爆破音,波形尖锐短促)和结尾的静音段。
▶ 截图描述:选中部分会用 “黑色背景” 标注,对应频谱图的相同区域,能看到明显的亮色横线(共振峰)。
操作 3:点击编辑窗口顶部的「Zoom」→「Zoom to selection」,放大选中区域,确认无杂音干扰。
▶ 截图描述:放大后,波形细节更清晰,频谱图的共振峰横线更明显,便于后续配置参数。
操作:点击编辑窗口顶部菜单栏「Formant」→「Show Formants...」,弹出 “Formant Settings” 窗口,按以下参数填写(针对中文语音):
| 参数名称 | 男性语音 | 女性 / 儿童语音 |
|---|---|---|
| Maximum formant (Hz) | 5000 | 6000 |
| Number of formants | 4 | 4 |
| Window length (s) | 0.025 | 0.025 |
| Pre-emphasis from (Hz) | 50 | 50 |
| 填写完成后点击「OK」。 | ||
| ▶ 截图描述:频谱图上会出现 4 条红色虚线,从下到上依次是 F1、F2、F3、F4,每条线沿元音片段连续分布(无明显断裂则参数正确)。 |
操作 1:确保仍选中目标元音片段,点击菜单栏「Formant」→「Extract formants...」,弹出 “Formant Table” 窗口(包含每 0.01 秒的 F1-F4 频率值)。
▶ 截图描述:表格有 “Time (s)”“F1 (Hz)”“F2 (Hz)”“F3 (Hz)”“F4 (Hz)”5 列,数值随时间轻微波动(正常现象)。
操作 2:点击表格窗口顶部的「Table」→「Save as text file」,选择保存路径,命名为 “语音 A_元音 a.txt”(便于区分),点击 “保存”。
▶ 截图描述:保存的 TXT 文件可用记事本打开,或直接导入 Excel(后续用模板分析)。
| 工作表名称 | 功能描述 | 核心字段(预设公式) |
|---|---|---|
| 原始数据导入 | 粘贴两段语音的 F1-F4 原始数据 | 时间、F1、F2、F3、F4(手动粘贴) |
| 平均值计算 | 自动计算每段语音各元音的 F1-F4 平均值 | 语音 A_元音 a_F1 均值(=AVERAGE (B2:B100)) |
| 差异度分析 | 自动计算两段语音的共振峰差异率 | F1 差异率(=ABS ((C2-E2)/C2)*100) |
| 综合判定 | 按标准自动输出 “通过 / 不通过” 结果 | F1 判定(=IF (G2≤5,"通过","不通过")) |
步骤 1:导入原始数据
打开 TXT 文件(如 “语音 A_元音 a.txt”),复制 “F1、F2、F3、F4” 列的数值,粘贴到 Excel “原始数据导入” 工作表的对应列(语音 A 列);重复操作,将语音 B 的原始数据粘贴到语音 B 列。
步骤 2:查看平均值与差异度
切换到 “平均值计算” 工作表,会自动显示语音 A 和语音 B 各元音的 F1-F4 平均值(如语音 A_元音 a_F1=700Hz,语音 B_元音 a_F1=720Hz);再切换到 “差异度分析” 工作表,自动计算出差异率(如 F1 差异率 = 2.8%)。
步骤 3:看综合判定结果
切换到 “综合判定” 工作表,若 F1-F2 差异率≤5%、F3-F4 差异率≤8%,则对应项显示 “通过”;全部通过则最终结论为 “高度可能为同一人”,有 1 项不通过则显示 “需补充语音验证”。
获取方式:将上述结构在 Excel 中新建工作表,手动输入预设公式(或告诉我你的邮箱,可生成空白模板发送,已包含公式,无需手动设置)。
使用提示:
原始数据需至少 50 个有效数值(即元音片段时长≥0.5 秒,确保平均值准确);
若某段语音的 F3/F4 数值波动大(如超过 ±200Hz),需重新提取(可能是选中了杂音段)。