特定人语音增强技术研究
我们利用增强型最小控制递归平均(IMCR)的噪声估计和面向决策的先验信噪比估计,提出基于统计模型的语音增强算法。在训练阶段,获得通用的梅尔倒谱系数的混合高斯模型。在语音增强阶段,利用当前帧的噪声功率谱和可调权重因子来调节IMCR噪声估计的最小跟踪进程。另外,基于统一混合高斯模型,一些重要的常量参数用频率变化参数来代替。例如这些参数:在决策方向先验信噪比估计中的权重参数,在IMCR的修正最小跟踪进程的调节权重因子。我们在各种稳态和非稳态噪声环境下评估可该语音增强算法的表现。从实验结果看,该算法比传统语音增强算法更适合作为语音处理系统的预处理方案。
图1 基于同一说话人模型的语音增强算法的总框图
表1 传统的和增强方法的感知语音质量评估(PESQ)结果
表2 总信噪比结果比较
表3 总体水平的组合测量(Covl)结果比较