|
摘 要:目的 比较不同语音输入法的异同,为进一步认识汉语病理性语言的音声特征提供参考。方法 11例腭咽闭合功能不全患者,男性6例,女性5例;年龄7~35岁,平均16.18岁。被检敏感音为/m/、/pa/、/ku/,分别直接和间接输入计算机语音工作站,测定音长、能量、音高和第一、二、三共振峰,并使用统计软件(SPSS9.0)对数据进行处理和分析。结果 两种语音输入法的音长、音高和第一共振峰无明显差异(P>0.05),而能量和第二、三共振峰有明显差异(P<0.01)。结论 直接语音输入法和间接语音输入法有一定的区别,二者不能互相代替。
在唇腭裂序列治疗中,语音治疗已越来越受到广大临床医师的重视。但有关病理性语音的研究在国内尚不多见。随着计算机技术的高速发展,计算机语音工作站(computer speech lab, CSL)也已进入了语音研究领域,它可以直接对语音进行图像化和定理分析,使“只能听”的声音“可视化”,使人们对语音的特性有了更加深入、全面的了解。由于大量的临床语音资料均由磁带保存,本文通过对病理性语音的直接输入和间接输入进行对照研究,希望能够阐明两种方法之间的异同,为进一步认识汉语病理性语音的音声特征提供参考。
1 材料与方法
研究对象:选自1999年6月~1999年9月在上海第二医科大学附属第九人民医院口腔颌面外科确诊的11例腭咽闭合功能不全(velopharyngeal incompetence, VPI)患者,男性6例,女性5例,年龄7~35岁,平均16.18岁,其中6例为腭裂术后腭咽闭合功能不全,3例为咽成形术后腭咽闭合功能不全,2例为先天性腭咽闭合功能不全。所有患者智力正常,无明显听力障碍,熟练掌握普通话,未接收过语音治疗。
研究方法:被检者取坐位,自然放松,距麦克风5cm,练习被检敏感音/m/、/pa/、/ku/后,直接输入CSL4300B(美国KAY公司)和录音(日本松下公司EAC录音器材)。录音机距麦克风5cm,磁带播放录音再次输入CSL。样本采样频率为10000Hz,均测量音长(DOMAIN)、能量(ENERGY)、音高(PITCH)和第一、二、三共振峰(FORMANT)的平均值。重复三次,取平均值。使用SPSS9.0对数据行配对t检验。
2 结果
间接输入法的平均能量较直接输入法低,而它的第二、三共振峰的平均值较直接输入法高(见表1),且有统计学上的差异(P<0.01),见表2。直接输入法的音长、音高和第一共振峰的平均值较间接输入法高,但无统计学上的差异(P>0.05),见表2。
表1 统计量
| |
|
均值 |
例数 |
标准差 |
标准误 |
| 1 |
音长a
音长b(SEC) |
33
33 |
0.568
0.551 |
0.123
0.138 |
0.021
0.024 |
| 2 |
能量a
能量b(dB) |
33
33 |
67.627
61.965 |
6.097
6.900 |
1.061
1.201 |
| 3 |
音高a
音高b(H2) |
33
33 |
200.899
192.945 |
47.001
44.261 |
8.182
7.705 |
| 4 |
第一共振峰a
第二共振峰b(H2) |
33
33 |
461.617
427.653 |
177.252
162.330 |
30.856
28.258 |
| 5 |
第二共振峰a
第地共振峰b(H2) |
33
33 |
1240.445
1413.815 |
235.222
216.350 |
40.947
37.662 |
| 6 |
第三共振峰a
第三共振峰b(H2) |
33
33 |
2249.395
2438.370 |
257.777
218.276 |
44.873
37.997 |
注:末位字母为a是直接输入法,末位字母为b是间接输入法。
3 讨论
CSL:CSL是一种动态音频频谱分析议,可将声音信号转变为可视图谱并输入计算机,具有语音信号获取、分析、编辑和回放功能,能提供图谱中的各种物理量并显示它们之间的动态关系。它操作简单、技术先进,分析手段主要包括波形图、FFT频谱和LPC滤波曲线、语图和音高,为语音学研究提供了一种准确而有效的仪器,也是目前国际上在语音分析中最常用和先进的仪器之一。它的优点为:对患者无损害,不带来痛苦,在学龄前儿童中也可广泛应用,既可研究元音,又可研究辅音,重复性和可靠性好。其不足之处是需要有一定的专业知识,同时其价格昂贵,还需要计算机、打印机和电腭图等配套设备,难以在基层医院推广。
责任编辑:姚红祥 |