图1 联合码本优化码本生成算法流程图
3 实验结果和分析
实际应用中,码本训练采用107 MB的语音文件,得到342302帧LSF参数(10维)和加权系数,训练矢量集足够大。在实际的2kbps语音编码算法中,对LSF参数进行3级矢量量化,比特分配为9/8/6,共23bits。利用联合优化码本生成算法进行300步迭代,与SR算法的第三级300步迭代结果进行比较,得到训练码本总畸变数据,如图2所示。
图2 联合码本优化MSVQ迭代效果图
可以看到,同样步数的JCO-MSVQ算法较SR算法能取得更小的量化畸变。SR算法经过一定步数的迭代,基本没有下探的空间。而JCO-MSVQ算法则能继续优化码本,获得更好的量化效果。并且,与SR算法不同,JCO-MSVQ算法中量化畸变是单调递减的,因在训练过程中每一步都是最优的(简化算法中是多进制搜索,因而是次优的)。统计量化谱失真,联合码本优化MSVQ比其他的MSVQ有明显的改善。在同一个LSF量化器中分别采用23bits SR码本(码本1)、24bits SR码本(码本2)和23bits联合优化码本(码本3),测试语音为一个3.5MB的语音文件,既有男声也有女声,共11348帧LSF参数。统计量化谱失真得到表1所示数据。
www.55dianzi.com
表1不同码本生成算法谱失真比较
从表1数据可以看到,同是23bits的量化,联合码本设计MSVQ与应用SR算法生成码本的MSVQ相比较,有大约1个比特的改善,接近于应用SR算法24bits量化的效果。甚至优于文献[2]中MSVQ算法的26bits量化(平均谱失真0.93dB)。平均谱失真为0.87dB,大于4dB的谱失真统计为0,达到了 透明量化 的要求。本文研究结果已经成功应用于1/2kbps可变速率声码器项目中。
参考文献
1 Itakura F. Line speCTRum representation of linear preDICtive coeffICients of speech signals [J]. J.Acoust.Soc.Amer.,1975; 57:S35
2 Paliwal K K, Atal B S. Efficient vector quantization of LPC parameters at
24 bits/frame [J]. Proc. ICASSP,1991:661~664
3 Juang B H, Gray A H. Multiple stage vector quantization for speech coding[J]. Proc.ICASSP,1982:597~600
4 Anderson J, Bodie J. Least square quantization in PCM [J]. IEEE Trans. Inform. Theory, 1975;IT-21:379~387
5 Chan W Y, Gupta S, Gersho A. Enhanced Multistage Vector Quantization by Joint Codebook Design [J]. IEEE Transations on Communications, 1992;40(11):1693~1697
6 Gardner W R, Rao B D. Theoretical Analysis of the High-Rate Vector Quantization of LPC Parameters [J]. IEEE Transactions on Speech and Audio Processing,1995;3(5):367~381
7 杨行峻, 迟惠生.语音信号数字处理 [M]. 北京:电子工业出版社, 1995
本文关键字:技术 综合-其它,单片机-工控设备 - 综合-其它
上一篇:基于NPX的新型轮胎压力监测系统