共查询到17条相似文献,搜索用时 93 毫秒
1.
2.
汉语语音听写机技术的研究与实现 总被引:3,自引:0,他引:3
文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎,并在PC机上构建了两个系统:非特定人汉语语音听写机 相似文献
3.
4.
汉语连续数字串语音识别系统 总被引:1,自引:2,他引:1
汉语数字串在语音识别中具有重要的地位,文章设计实现了一个实用化的汉语连续数字串语音识别系统,并针对汉语数字混淆度大的特点进行了分析,提出了模型改进和语速控制策略,使系统具有很好的整体性能。 相似文献
5.
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolKit)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。 相似文献
6.
徐华 《计算机工程与应用》2005,41(21):116-118,162
本文研究了基于互信息估计的汉语连续数字语音识别系统,其中包括语音信号的预处理部分、识别模板的训练、识别匹配算法以及后续处理部分,文中就系统的各个部分的具体实现进行了阐述,给出了系统部分识别结果,指出了系统的一些可以改进的方向。 相似文献
7.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 相似文献
8.
汉语连续语音中声调识别的特殊性研究 总被引:1,自引:0,他引:1
大词汇连续语识别是当前语音识别研究的主流,探讨其中声调识别的特殊是一项有意义的工作,本文从声调获取,语音分割,声调模式和声调识别等进行了研究,通过对现有研究成果的分析和总结,并结合自己的研究工作,得出了若干结论,提出了基于音节的连续语音声调识别思想。 相似文献
9.
本文主要介绍了连续语音识别系统的构建过程,分析了连续语音识别系统构建的方式和采用音素构建连续语音识别声学模型的基本方法。阐述了利用隐马尔可夫工具包搭建的连续语音识别系统,给出了系统评估方法,系统使用日本标准JNAS数据库进行建模并使用北海道大学日本学生的发音进行实验,验证模型的有效性。 相似文献
10.
11.
本文介绍了在连续语音识别和语音机器翻译方面所进行的工作。我们已在中等词汇量范围、限定说话主题的条件下,实现了特定人的连续话句的识别。并实现了一个英汉语音翻译实验演示系统。 相似文献
12.
为了节省考前考生信息核对的时间和提高其准确性,提出一种基于FPGA和DM6437框架的智能人脸识别系统。FPGA和DM6437组成了系统的硬件平台并负责图像的采集、预处理和图像识别算法的实现,人脸识别过程由肤色检测和改进最近邻法来完成。通过系统的硬件平台支持和人脸识别算法的植入,可以快速地分割出视频中人脸图像,并识别图像中人物身份。该系统具有高性能和高可靠性的特点,可以应用在各种类型的考场上。 相似文献
13.
本文介绍了以一种比较两个句子的新的有效算法为基础而编制的连续语音识别系统性能评估软件,它通过比较连续语音识别系统输出的若干句子和相应的标准句子,得到系统性能的定量数据。该软件的可靠性得到大量实验验证。 相似文献
14.
VQ/HMM二级音节识别的研究 总被引:1,自引:0,他引:1
HMM技术在语音识别是得到较为成功的应用,然而VQ/HMM对在词表的识别速度及识别率仍不理想,文中根据系统实现中的实时性和识别率的要求,提出了初始码本均匀法,对参加训练的各音先对其求平均,然后用各音的平均值组成初始矢量的空间,并采用码本快速迭代法以及标号直方图法与HMM识别相结合的二级识别方法,提高了系统的识别率和识别速度,此方法简单,易于实时化。 相似文献
15.
为了在远程教育环境中满足多媒体课件的关键词检索需求,描述了一种基于矢量量化(VQ)及连续语音识别(CSR)的关键词检索系统的设计与实现。该系统首先利用矢量量化算法对声学特征空间进行聚类并生成码本;接着利用该码本对语音文件逐帧进行处理并保存若干与该帧特征最相似的码表向量所对应的码值做成特征矩阵;然后利用改进的快速符号查找算法从特征矩阵中找出若干候选结果段;使用经简化的连续语音识别算法对候选段进行验证筛选,从而得到最终的结果。在此基础上利用一些测试数据给出其性能表现并做出分析。 相似文献
16.
基于遗传算法的手写体汉字识别系统优化方法的研究 总被引:8,自引:0,他引:8
为了改善手写体汉字识别系统的性能,提出了前端单字识别器(SCR)和后端语言解码器(post-processing system)有效结合的模型,并且利用遗传算法对系统参数进行优化。以联机手写体汉字识别系统作为SCR进行测试,首选准确率为69.46%,汉字识别的准确率达到87.59%,较优化前提高6.4%。实验结果表明,遗传算法(GA)是一种有效的优化系统参数的方法。 相似文献