BP神经网络在汉语数字语音识别中的应用
详细信息 本馆镜像全文    |  推荐本文 | | 获取馆网全文
摘要
从语音信号产生的数字模型出发,对1~10这10个汉语数字的语音信号进行预处理,提取了Mel频率倒谱系数,并将特征参数序列进行非线性时间规整为固定的帧数,使用BP神经网络的训练和识别,研究该方法的可行性和有效性。结果表明,在噪声环境下1,7,9的识别率为80%,而2,3,4,5,6,8,10的识别率都是100%,识别率主要受噪声、不同人的发音不同等因素的影响。该方法具有可行性强、识别率高的特点,可应用于语音识别系统。
引文
[1]余华,李海洋,李启元.基于径向基神经网络的数字“0”~“9”语音识别[J].江西师范大学学报,2009,33(6):701-705.
    [2]金琰,张健.基于BP网络的孤立数字识别[J].辽宁工学院学报,2007,26(6):365-367.
    [3]郑展恒.数字语音识别系统[J].桂林电子科技大学学报,2011,31(6):439-441.
    [4]刘炀,汤传玲,王静,等.一种基于BP神经网络的数字识别新方法[J].微型机与应用,2012,31(7):36-39.
    [5]卜富清,王茂芝,于庆刚.基于BP神经网络的数字识别[J].长江大学学报,2009,6(2):293-294.
    [6]周铁军,顾晓辉,吕艳新.基于BP神经网络的地震动信号识别[J].现代电子技术,2012,35(10):100-102.
    [7]路青起,白燕燕.基于双门限两级判决的语音端点检测方法[J].电子科技,2012,25(1):13-15.

版权所有:© 2023 中国地质图书馆 中国地质调查局地学文献中心