首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
本文提出了一种基于模糊自适应Hamming网络的连续汉语识别方法,用模糊自适应Hamming网络来估计HMM中的状态观测概率。结合HMM对动态时间序列极强的建模能力和神经网络的分类决策能力来提高语音识别的准确率。通过对非特定人汉语连续词的语音识别实验,证实了该方法的有效性。  相似文献   

2.
当前的语音识别模型在英语、法语等表音文字中已取得很好的效果。然而,汉语是一种典型的表意文字,汉字与语音没有直接的对应关系,但拼音作为汉字读音的标注符号,与汉字存在相互转换的内在联系。因此,在汉语语音识别中利用拼音作为解码时的约束,可以引入一种更接近语音的归纳偏置。该文基于多任务学习框架,提出一种基于拼音约束联合学习的汉语语音识别方法,以端到端的汉字语音识别为主任务,以拼音语音识别为辅助任务,通过共享编码器,同时利用汉字与拼音识别结果作为监督信号,增强编码器对汉语语音的表达能力。实验结果表明,相比基线模型,该文提出的方法取得了更优的识别效果,词错误率降低了2.24%。  相似文献   

3.
基于模糊聚类神经网络的语音识别方法   总被引:8,自引:0,他引:8  
刘宇红  刘桥  任强 《计算机学报》2006,29(10):1894-1900
提出了一种基于模糊神经网络的语音识别方法.该方法以模糊系统模型为基础,利用改进的模糊聚类辨识算法,构成一种新型的模糊聚类神经网络(FCNN),并将其作为概率密度函数的估计器,对每个状态的输出进行预测.它不仅能有效地在语音识别中引入帧间相关信息,而且能克服状态输出概率密度函数为混合高斯分布的束缚.通过对非特定人汉语孤立词和连续音节的语音识别实验,证实了该方法的有效性.  相似文献   

4.
一种基于曲线拟合的二音节汉语声调识别方法   总被引:1,自引:0,他引:1  
本文提出了一种利用曲线拟合的方法,对连续二音节汉语语音进行了声调识别,并且加以实现。它采用倒频谱分析技术提取语音的基音周期,并利用倒频谱参数及短时功率进行音节分界。实验证明.基于曲线拟合的汉语声调识别方法,具有算法简单,可适用不同的说话人、高识别正确率等优点,是一种行之有效的方法。  相似文献   

5.
为了能够对文档中的少数民族文字种类进行正确地识别分类,提出一种基于小波分析与改进的二次分类函数(MQDF)的少数民族文字种类识别方法.该方法采用多辨识小波分解,从而获得小波能量和小波能量比例分布的特征描述,利用MQDF分类器对少数民族文种进行识别.构建藏文、西双版纳傣文、纳西象形文、维吾尔文、德宏傣文和彝文6种常用的少数民族文字及汉字、英语共8种文字的样本库,采用该方法对少数民族的样本库进行了进行训练和测试.实验结果显示,该方法在多层小波分解的情况下,对于少数民族文种识别的精度好于传统的贝叶斯和KNN.  相似文献   

6.
针对爆发谱特征不稳定的问题,论文提出了一种基于能量变化率的汉语塞音检测方法。该方法首先基于Seneff听觉谱提取了一组描述音段能量变化率特性的参数,然后采用Fisherface方法进行特征变换,变换后的特征采用K近邻(KNN)分类器进行分类,实现了塞音的检测,最后利用留一法对模型性能进行交叉验证。实验结果表明,干净语音塞音检测准确率可以达到96.39%,信噪比10dB的语音塞音检测准确率可达到88.07%,模型具有较好的稳定性和泛化性能。  相似文献   

7.
为了进一步提高语音识别系统的准确率,使语音产品应用更加方便,提出了一种隐马尔可夫模型和代数神经网络相结合的语音识别方法.利用隐马尔可夫模型生成最佳语音状态序列,将最佳状态序列的输出概率作为前馈型神经网络的输入,通过代数神经网络进行分类识别.使用Matlab7.0实验平台进行仿真,实验结果表明,与传统神经网络相比,该方法在收敛速度、鲁棒性和识别率方面都有改善.  相似文献   

8.
针对汉语语音情感识别问题,提出了一种基于脉冲耦合神经网络(PCNN)的识别方法。该方法将语音转化为语谱图后输入到PCNN,得到输出图像的神经元点火序列及其熵序列作为语音情感的特征,利用其特征实现语音情感识别。实验结果表明,该方法可以有效地识别“高兴”与“平常”这两种不同的情感。该方法将PCNN引入到语音情感识别的应用研究中,开拓了语音和图像信号结合处理的新领域,同时对于PCNN的理论研究和实际应用具有重要的现实意义。  相似文献   

9.
手指语是用手指指式进行交流,一个指式代表一个汉语拼音字母,按照汉语拼音方案 拼成普通话.文中提出了一种基于多特征多分类器的汉语手指语识别方法,并利用该方法建造 了手指字母流识别系统.实验表明,该方法的识别效率明显优于基于单分类器的识别方法.  相似文献   

10.
王波  徐毅琼  李弼程 《计算机工程与设计》2007,28(10):2401-2402,2416
提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述.该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号