基于数据驱动的噪声功率估计算法研究文献综述

 2023-09-25 08:09

文献综述

一、文献综述与调研报告:(阐述课题现状及发展趋势,课题的价值、参考文献)

课题现状及发展趋势

噪声功率谱估计是大多数单通道语音增强方法的重要组成部分,它的准确程度对增强语音质量具有决定性的影响。如果噪声估计过低,在语音增强过程中,容易产生大量的残留噪声;如果噪声估计过高,会导致语音信号畸变和可懂度下降。过去的几十年里,提出了许多噪声功率谱估计方法[1-8]。传统方法是利用 VAD 检测非语音帧,然后对这些非语音帧的功率谱进行滑动平均,形成噪声功率谱包络[9-10]。然而,在嘈杂环境下,语音活动期间的背景噪声会发生较大变化,基于 VAD 方法的可靠性会急剧下降[11]。为了提升噪声估计方法的性能,研究人员提出了许多噪声功率谱估计方法,大致可以分成以下几类。

(1)基于直方图(histogram)的噪声估计方法

直方图是统计语音信号中每一频率值与其出现频数关系的图表,包含了丰富的语音特征,反应了频率值的整体分布情况[11-12]。每个频带出现最频繁的能量值反映了该频带的噪声水平,对应于能量直方图的最大值。基于直方图噪声估计的典型方法是基于过去的功率谱的直方图来得到噪声估计,也可以对噪声进行一阶递归平滑,以滤除估计中出现的离群值。特点是能够充分利用噪声的全局数据,实现精确估计。但它通常伴随着一定的时间延迟,是一种离线估计方法,难以应用于实时语音处理系统[12]

(2)基于最小统计的噪声估计方法

Martin等人提出了采用最小统计(Minimum Statistics, MS)的方法追踪噪声功率谱[13],该方法认为各个频带是独立的,在每一个频带上追踪噪声功率谱。它假定各个频带上的功率谱包络的谷点处不存在语音,真实的噪声功率谱是这些谷点处谱值的有偏估计。MS 方法的优点在于即便噪声功率谱发生剧烈变化,在一定的时间延迟后,模型仍然能够跟上噪声的变化,但它对于噪声功率谱的变化有一定的时间滞后。

(3)时间递归平均方法

噪声大多对语音频谱具有非均匀性的影响,通过对带噪语音的统计特性和对频谱的研究发现:同一帧中,不同频带内语音分量的强弱是不同的;不同频带内噪声对语音的影响也不同,即同一帧内,不同频谱分量可能具有不同的 SNR 或语音出现概率。当某个频带的语音出现概率较低的时候,就可以更新单个频带的噪声谱,从以上可以衍生出递归平均噪声估计方法[14-15]。递归平均方法中,噪声功率谱的估计是基于过去的噪声估计与当前带噪语音谱的加权平均。权重根据每个频点的实际 SNR 或者语音出现概率来自适应的改变。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。