首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
范京  陈永宁  刘惠华 《信号处理》2005,21(Z1):180-183
本文提出了一种新的汉语语音模型-多组状态转移顺序聚类模型(MSSC).该模型采用了马尔可夫过程的状态转移方式,描述汉语语音的特征矢量序列的时序过程,同时采用了动态时间匹配DTW的比对概念和直接特征状态而不是HMM法的隐状态.新的模型具有多组子模型特点,从而对语音速度的变化,语音轻重的变化等有较强的适应能力.在描述状态转移方面,增加了记录各状态的自转移次数,用其作权重可更好地利用特征信息,提高识别率.另外,该方法的物理意义明显,故可以根据不同的特征矢量,进行合理的加权评判,且可以方便地扩充特征矢量的种类,更好的利用了汉语语音中的有用信息,进一步提高识别的正确率.本文从原理上及实际的测算结果证实了新方法的有效性.  相似文献   

2.
汉语数码语音识别自适应算法   总被引:4,自引:0,他引:4  
说话人自适应是提高非特定人语音识别性能的有效方法之一。本文将MAP算法应用于汉语数码语音识别中,并讨论了几种加快自适应速度的方法以及自适应对非自适应人的影响。实验表明,MAP算法可以有效地降低汉语数码识别对被适应人的误识率,而且对非自适应人性能影响很小。  相似文献   

3.
4.
汉语语音的识别,一定要结合汉语的特点。本文介绍了一种用汉语辅音音长信息加速语音模式匹配和用起终点过渡音识别语音的方法。实验表明:该系统响应迅速,已达到了98%(平均)的正确识别率。  相似文献   

5.
全音节连续汉语语音识别的研究   总被引:3,自引:0,他引:3  
在大词汇量连续汉语语音识别的研究中,我们根据汉语语音自身的特点,选用全音节作为识别单元,与音对文法相结合,以期达到实现大词汇量语音识别的目的.实现连续语音识别时,不需预先切分音节,而使用帧同步型网络搜索算法并在搜索中予以音长控制,用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估,获得了40.40%的音节识别率.  相似文献   

6.
刘刚  陈伟  郭军 《中国通信》2010,7(2):132-138
 在汉语语音识别中,由于汉语构词的特点,使得基于词的汉语语音识别结果评价不准确。论文对于传统连续语音识别结果评价算法进行了改进,提出了一种基于字词混合的汉语连续语音识别结果评价算法,可以有效完成基于词的识别结果评价,同时也将识别结果评价由四种情况(正确、替代、插入、删除)扩展到六种情况(增加了插入式替代和删除式替代),可以为语音识别的后处理提供更多有用的信息。实验表明,本文所提算法可以有效降低传统评价算法带来的虚假错  相似文献   

7.
针对频域盲源分离过程中存在的排序模糊性问题,提出了一种新的解决方法.该方法将整个频段分为低频、中频和高频三个部分.在低频段采用比较不同频率点间幅度相关系数大小的排序算法,在中频段采用基于波束形成方位估计的排序算法,在高频段采用比较幅度相关系数大小和波束形成相结合的排序方法.实验中采用评价盲分离算法性能的工具箱BSS_EVAL作为评价标准,仿真结果表明,该排序算法的分离性能大大优于单独采用比较幅度相关系数大小的排序算法和单独基于波束形成方位估计的排序算法.  相似文献   

8.
一种新的故障链路识别算法RPI   总被引:1,自引:1,他引:0  
针对目前大多数故障链路识别算法不能兼顾良好稳定性和低计算复杂性的问题,该文提出一种基于参考路径的故障链路识别算法RPI(Reference Path based lossy link Identification algorithm)。该算法根据路径间的性能差异,从经过同一链路的所有路径中选取一部分作为该链路的参考路径,然后采用启发式方法根据参考路径间的性能相关性识别该链路的状态。相较已有算法,RPI更充分地利用了测量数据的可用信息,具有更好的稳定性,同时启发式估计策略保证了算法的低计算复杂性。仿真结果表明RPI能够在多种网络场景下较同类算法更精确地识别出故障链路。  相似文献   

9.
一种新的红外机动目标识别算法   总被引:1,自引:0,他引:1  
为了改善因红外图像中目标轮廓模糊造成的识别率低,提出一种适用于红外机动目标的识别算法。通过自适应步长的细菌觅食算法对BP神经网络进行优化,利用图像中目标的最左点和最右点及两极点上部的目标边缘信息构造以局部面积比组成的特征向量,通过神经网络对目标分类识别。实验结果表明本文提出的识别算法不仅提高了BP神经网络的收敛速度和计算精度,同时有效地提高了对机动目标的识别率,当目标部分区域被遮挡时也有很好的识别效果。  相似文献   

10.
本文提出了一种基于升降周期的语音识别算法(TPMRF).它以语音抽样信号的升降周期为特征,以其转移概率矩阵为模板.该方法数学公式简单.计算量小,可用于精度要求不是很高,但速度要求很快的小词汇量孤立词识别的实际应用环境,也可作为高精度识别中的初级分类识别.  相似文献   

11.
Dragon Systems公司最近推出了一种名为Dragon Dictate的语音识别系统,它能以每分钟40个字的速度识别单词和建立文本,5秒之内即可识別一个单词或话音,字间停顿仅0.25秒。整个系统由一个8 bit的ISA总线插件、一个消除噪音的麦克风和一套语音识别软件构成。软件包括25000个常用词汇和由用户定义的5000个附加词汇的语言模型。用户可以自定专用名称、专业术语等,还可以用词的组合定义一些编辑指令和文字处理指令。例如,系统可把“Save file”当作命令来识别,而存入一个已打开的文件。  相似文献   

12.
语音识别是语音信号处理的一个重要研究方向,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,广泛应用于控制、通信、消费品等行业。文中介绍了一种简单的语音识别算法。该算法主要流程包括预处理、端点检测、提取特征值、模式匹配4个过程,其中端点检测以幅值为标准,特征值采用临界带特征矢量,模板匹配采用DTW算法。主...  相似文献   

13.
孙卓  岳振军 《电声技术》2007,31(6):37-40
汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。  相似文献   

14.
一种新的多通道混合语音时域盲分离算法   总被引:1,自引:1,他引:0  
陶玉福  刘庆华  黄斌  樊伟 《电声技术》2009,33(7):60-62,72
卷积混合语音进行盲源分离时,不能直接应用独立分量分析(ICA)算法。采用一种新的卷积混合语音模型,对多通道混合语音使用近来提出的时域EFICA算法进行盲分离,然后利用聚类和重构算法来恢复源信号。通过真实语音实验表明,提出的算法能有效地分离混合语音信号。  相似文献   

15.
本文提出了一种新的语音信号共振峰的提取方法。在LPC幅度谱上搜寻最大的极大值点所对应的频率,并将它作为构成声道参数的某一谐振腔所对应的共轭复根的角度,再通过LPC系数的相—频特性的一次导数和三次导数相结合的方法求出这对共轭复根的幅度,从而确定了该谐振腔,也就得到了该谐振腔的共振峰。然后,用LPC的多项式对该谐振腔所对应的多项式做多项式除法,得到新的LPC系数,接着重复前面的步骤,可以较好地求出在LPC谱中对应幅度最大的两个共振峰。  相似文献   

16.
语音增强是消除噪声干扰的主要手段,在语音处理系统中得到广泛应用。传统语音增强算法认为相邻帧语音幅度谱之间是相互独立的,而研究表明语音幅度谱时频点之间存在相互依赖关系。缺乏对邻域时频结构信息的利用使得传统增强算法的性能难以进一步提高。本文首次将数据场引入到对语音的听觉感知领域,用数据场对语音的时频依赖性进行建模,提出一种新的基于数据场的语音增强算法。该算法通过最小化势场分布的熵确定了时频点之间的相互作用力程,在带噪语音数据场中估计噪声的最小统计量得到二值时频掩蔽值,最后利用二值时频掩蔽消除噪声干扰。实验测试表明,与Martin算法相比,基于数据场的语音增强算法在提高去噪效果的同时能有效减少语音的失真。   相似文献   

17.
针对人脸面部表情的识别率易受非均匀光照影响,进而降低人脸面部表情辨识率的问题,提出一种融合局部特征与深度置信网络(DBN)的人脸面部表情识别算法。首先提取出人脸面部表情图像中的局部敏感质量分布图(LSH)非均匀光照不变特征;其次通过双编码局部二值模式(DCLBP)提取出人脸面部表情的边缘局部细节纹理特征;然后计算其各自特征的基本标准差来进一步确定自适应融合特征的权重值,并以此构造融合后的人脸面部表情特征;最后将部敏感质量分布图(LSH)与双编码局部二值模式(DCLBP)融合后的人脸面部表情特征进行训练深度置信网络(DBN)模型,将训练后的深度置信网络(DBN)模型进行人脸面部表情识别。在JAFFE人脸面部表情数据库和自建的维吾尔族人脸面部表情数据库中识别实验表明,该算法比其他4中算法的对比中其识别率分别至少提高了4.3%和5.22%,具有很好的鲁棒性和有效性。  相似文献   

18.
基于单音信号重构的识别算法是无线电频谱监测中比较常用的识别方法,针对该算法存在运算量较大、实时性差的问题,提出了一种新的单音信号快速识别算法。基于单音信号重构的识别算法是先利用两次FFT(Fast Fourier Transform)构建出单音信号模板,再通过计算单音模板与目标信号之间的相关系数,来分类识别出单音信号。而新方法推导出只做一次FFT却等价于2次FFT的相关模板匹配识别的快速计算方法,新算法相比已有算法的运算量减少近一半,识别性能与已有算法一致。仿真试验证明了新方法的可行性和有效性。  相似文献   

19.
现有的调制识别算法多应用到信号的瞬时频率和瞬时相位信息,而瞬时频率和瞬时相位的提取需要载频、码元速率等先验信息,载频的偏差限制了其识别性能的进一步提高。基于此,提出了一种仅依靠信号瞬时幅度信息进行肓识别的新算法.该算法不需要任何先验信息,介绍了一种对MFSK和MPSK信号非常有效的瞬时频率的近似提取法,然后选择特征量对调制类型进行分类识别,最后进行计算机仿真,仿真结果表明该算法识别性能良好,对载频偏差不敏感,有着很好的稳定性。  相似文献   

20.
一种新的基于结构特征的虹膜识别算法   总被引:2,自引:7,他引:2  
苑玮琦  徐露  林忠华 《光电子.激光》2006,17(10):1250-1254
提出了一种新的基于结构特征的虹膜识别算法。其基本思想是:首先,通过图像预处理得到归一化的虹膜图像;其次,利用逻辑判断的方法在虹膜图像上寻找局部极小值点;再次,去掉伪特征点,生成固定长度的虹膜编码;最后,计算2个虹膜编码间的“与”距离,根据该距离给出识别结果。在该CASIA虹膜图像数据库上进行了大量的实验,结果表明,该算法与现有的虹膜识别算法相比,识别准确率更高,识别速度更快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号