基于BP神经网络的语音特征信号识别文献综述

 2022-08-03 11:08

文献综述

——基于BP神经网络的语音特征信号识别

  1. 研究目的及意义

语音信号的分类近年来被广泛应用,尤其是在各类音乐软件中对音乐风格的分类,使得软件可以根据用户的搜索记录,自动推算出用户的音乐偏好,以便于实现精准高效的推送,极大地提升了用户体验。在语音信号分类过程中,语音特征信号识别占据着极其重要的地位。由于语音的多样性与不确定性,采用传统方式进行的大规模语音特征信号识别速度慢,精确度不高。针对这些问题,提出一种基于BP神经网络的语音分类方法,以提高语音特征信号识别的速度与准确性。人工神经网络以其良好的抽象分类特性,被运用于语音特征信号识别系统的开发,而MATLAB矩阵运算能力很强,用MATLAB实现BP神经网络在语音特征信号识别上的应用,可以很好地提升语音识别的学习速度与准确率。

  1. 国内外研究概况

1952年诞生在贝尔实验室的世界上第一个语音识别系统一Audry系统,这个系统当时只能识别十个英文数字,是通过数字在发音过程中的元音共振峰来进行识别的,这开创了人类语音识别的开端。英国的Denes和Fry研制出了一个能够识别个辅音和个元音的识别器,他们采用了模式匹配器和谱分析仪。同年成功利用计算机通过语音控制打字机,首次依靠语音旳统计信息来建立数据模板库。到了上世纪六十年代,计算机应用技术和数字信号处理的飞速发展进一步推动了语音识技术的前进。提出的端点检测技术使得语音识别有着显著的提升。随后动态规划技术和线性预测编码使得语音信号模型的产生得到了很好的解决,并极大的促进了语音识别的发展。到了七十年代,动态归整和线性预测技术日渐成熟,广泛应用于语音识别领域,特别是动态归整应用于语音样品模板和测试模板之间的非线性匹配线性预测技术应用于特征参数的提取,使得孤立词的识别成为可能。进入到八十年代,对小词汇的识别已经取得了很高的识别率,语音识别系统的技术也有了更大的发展,便开始进行大词汇量的语音识别研究。矢量量化,隐马尔可夫模型以及人工神经网络技术相继应用于语音识别中,尤其是隐马尔可夫模型获得了充分的发展,成为当时语音识别的主流技术。

相比较于其他发达国家的语音识别研宄,我国相对要晚一步,不过近些年来也取得了较快的发展。我国的语音识别最早是年中科院通过电子管电路来实现了十个元音的识别。在随后许多年中,我国的语音识别技术始终没有得到突破性的进展,所以一直发展很慢。直到我国执行这项科技计划之后,语音识别技术被作为电子产品的关键技术得到重点扶持,我国的研宄机构开始有组织的语音识别研宄。随着我国经济进入全球化,科技创新也和世界接轨,让我们有机会接触到国外的许多先进的经验。我国的语音识别技术有了质旳飞跃,其水平逐渐达到了国际标准,在汉语语音识别方面,还处于领先水平。其中具有代表性的是清华大学的刘润生课题小组研宄出的非特定人的汉语语音拨号电话机,清华大学电子工程系研制出的基于非特定人连续语音数码串识别系统等。

  1. 研究内容及计划

本文将建立BP神经网络模型并对语音特征信号进行分类训练,最终对多类语音特征信号进行准确识别分类。

首先用BP神经网络对四类不同风格的音乐进行分类学习,如古筝、民谣、摇滚、流行,每段音乐用倒谱系数法提取500组24维语音特征信号,共2000组,其中随机抽取1500组用于神经网络的训练,500组用于最终的测试。在每组信号中添加一维标识符,用于区分四类音乐,例如标识符为1,则输出为[1 0 0 0},若标识符为2,输出为[0 1 0 0],以此类推。

第二步是建立BP神经网络进行训练,根据最小均方误差(对均方误差求偏导,以求得最小值)调整权值和阈值。将训练好的BP神经网络对1500组语音特征信号进行分类训练。

第三步将训练好的神经网络对500组语音特征信号进行分类测试,根据测试结果对算法进行改进。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。