西  安  交  通  大  学  学  报

Vol.40 No.04

Journal of Xi'an Jiaotong University

Jan.2006

engl.gif (1752 字节)

zfh.gif (1500 字节)

 

基于心理声学模型的高性能语音质量评价算法
张军,张德运,高磊,赵东平
(西安交通大学电子与信息工程学院,710049,西安)

摘要:提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之间的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.
关键词:心理声学模型;美尔倒谱;感知扰动;质量评价
中图分类号:TN912文献标识码:A文章编号:0253-987X(2006)04-0437-04