首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
用DP(动态编程)匹配算法实现语音识别,能比以前的识别简单,因而能得到快速响应。此外,由于所提取的特征向量动态地匹配给存贮器中特征模板,因而能减少由同一个字的时间多样性所造成的对精度的影响。再者,对每个模板长度限制为小于80个字节,这样,占存贮空间较省,且便于存盘。最后,介绍用语言输入来控制一个小型机器人,得到满意的结果,精度达90%。  相似文献   

2.
语音识别技术展望   总被引:1,自引:0,他引:1  
<正> 自从ENIAC问世之后,立即有人想到要让计算机听懂人说话,并开始了这方面的研究工作。所以说,语音识别的研究历史与计算机的发展历史一样长。计算机的发展已历经了从电子管到晶体管以至超大规模集成电路的好几代,单单微机的CPU就从早期的4004发展到今天的奔腾三代,涌入了普通家庭,已与我们的数字化生活密不可分。但是,与计算机同步发展的语音识别技术似乎并不遵循摩尔规律,它的产品也迟迟未能进入市场。时至今日,语音技术产品的市场日益升温,语音识别技术已经成为计算机进一步在亿万百姓中普及的关键技术,也必将成为信息产业的标志性技术和未来计算机的重要特征。  相似文献   

3.
4.
骄阳 《电脑》1999,(5):34-35
语音识别技术出现很多年了,但真正进入实用,还是近两年。在国内,人们听说得最多的是IBM的Via Voice,而几乎所有的中文应用软件也是使用Via Voice做为语音识别引擎。实际上,目前在语音识别技术方面有作为的并非IBM一家,而且Via Voice也并非是最好的语音识别软件。这里,我们来看看几款不错的语音识别软件,并做一个比较性的评价。  相似文献   

5.
6.
文章阐述了一种改进的基于自适应模型的语音识别方法.概括归纳了实现这种方法的三大模块:语音数据采集模块,基于自适应模型的语音识别模块和体现应用的结果显示模块.  相似文献   

7.
8.
9.
“发展中的语音识别技术正推动着透明化计算,使人与计算机之间的互动更加容易。”IBM语音系统部门的Anne-Marie Derouault 如是说。 进入新世纪以来,IT世界在经历着一场向人机互动技术的大转移,这在很大一部分上借助于语音识别技术。语音识别技术的出现不但开始改变我们与PC的交流方式,还会进一步影响我们从事商业活动和获取信息的模式。语音识别技术在过去  相似文献   

10.
语音识别/说话人识别中的高效算法   总被引:1,自引:0,他引:1  
通过对硬件平台特点的研究,采用了多帧同步搜索算法、马氏距离并行内积化和并行指令集的技术对语音识别和说话人识别进行了优化,识别速度提高了3倍。在P41.4GHz的机器上,可以同时完成120路的说话人识别任务。  相似文献   

11.
本文介绍了在连续语音识别和语音机器翻译方面所进行的工作。我们已在中等词汇量范围、限定说话主题的条件下,实现了特定人的连续话句的识别。并实现了一个英汉语音翻译实验演示系统。  相似文献   

12.
语音识别的顽健性与语音库的建立   总被引:1,自引:0,他引:1  
汉语语音识别在近十几年有很大进展,现今已有一些系统投入实际应用,并初步商品化。但是一些系统的顽健性较差,因而这方面的问题将成为今后语音识别研究的一项主要任务。为此我们建立了一个适用于语音识别顽健性研究的汉语语音库,并详细介绍了它的构成、特点和试验结果等。  相似文献   

13.
为了在远程教育环境中满足多媒体课件的关键词检索需求,描述了一种基于矢量量化(VQ)及连续语音识别(CSR)的关键词检索系统的设计与实现。该系统首先利用矢量量化算法对声学特征空间进行聚类并生成码本;接着利用该码本对语音文件逐帧进行处理并保存若干与该帧特征最相似的码表向量所对应的码值做成特征矩阵;然后利用改进的快速符号查找算法从特征矩阵中找出若干候选结果段;使用经简化的连续语音识别算法对候选段进行验证筛选,从而得到最终的结果。在此基础上利用一些测试数据给出其性能表现并做出分析。  相似文献   

14.
基于MFCCs滤波的电话语音识别的通道补偿方法   总被引:4,自引:0,他引:4  
韩纪庆  高文 《计算机学报》1998,21(12):1125-1130
本文提出一种基于MFCCs滤波的通道补偿方法RMFCC。它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价。RMFCC的性能也优于CMS和二级CMS。通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径。  相似文献   

15.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

16.
为实现文本/语音驱动的说话人头部动画,本文提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network, DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。  相似文献   

17.
置信度的原理及其在语音识别中的应用   总被引:5,自引:2,他引:5  
由于置信度模型可以有效地判断观测数据与语音模型之间的匹配程度,因此可以用来对语音识别结果进行假设检验,定位识别结果中的错误,从而提高系统的识别率和稳健笥,讨论了语音识别中置信度的基本原理,、在值方法、模型性能评价方法、比较全面地介绍了置信度在语音识别中的各种,实验结果表明,置信度在语音识别的搜索的剪枝过程、说话人自适应以及拒识和验证方法面都有显的作用。  相似文献   

18.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音  相似文献   

19.
Since the emergence of the personal digital assistant (PDA), developers have attempted to create input methods that allow users to enter accurate data at speeds that approach those achieved with the personal computer. Common text entry methods (handwriting and soft keyboard) allow for rates that are unacceptably slow for many purposes. The objective of this paper is to consider the possible benefits of speech-to-text input mechanisms (dictation and voice spelling) for handheld devices. By modeling throughput based on varying rates of speech, correction speeds, and system recognition accuracies, we can compare expected speech throughput rates to current throughput rates for PDAs.  相似文献   

20.
汉语连续语音识别系统与知识导引的搜索策略研究   总被引:1,自引:0,他引:1  
从整体上介绍了汉语连续语音识别系统的基本原理,并重点对声学和语言两个层面的建模与搜索策略进行了分析.在对传统帧同步搜索算法进行研究的基础上,提出了基于统计知识的帧同步搜索算法SKB-FSS.它包含了三个主要的功能层次:基于归并的音节切分自动机产生确定的搜索边界点,由统计得到的差分状态驻留信息控制搜索过程中的状态转移,利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径剪枝.实验结果验证了该搜索策略的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号