首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
汉语大词汇量连续语音识别系统研究进展   总被引:6,自引:1,他引:5  
大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。  相似文献   

2.
通过窄带信道将语音信号传输到远端的识别系统,从而实现远距离的人机对话,具有重要的现实意义。在2.4kbps的速率下,语音编码算法依然可以合成出可懂度非常高的语音,但是这样的语音信号与原始语音相比还是有巨大的损失。低速率语音编码算法对于语音识别产生的影响是巨大的,因此必须想办法减轻这种损失对于识别的损害。在此选择了三种不同的低速率语音编码器,分别使用LPC(Linear Pledictive Coding,线性预测)算法、MELP(Mixed Excitation Linear Prediction,混合激励线性预测)算法和IMBE(Improved Multiband Excitation,增强多带激励)算法,都在2.4kbps的速率下工作,将其对语音识别系统的影响进行了比较。对于特定人连续语音识别系统和非特定人连接词识别系统,在使用不同的特征矢量时,不同编码器产生的识别效果有比较大的差异。实验结果表明,语音编码器和语音识别系统的结构有很重要的联系,尽量采用相近的结构有助于获得良好的识别结果。另外,改变提取语音识别特征参数的方式也会有利于提高语音识别系统的性能。  相似文献   

3.
基于词网模型的连续语音识别系统在各方面得到了广泛应用,如语音拨号、语音指令、语音菜单、语音导航及语音电话簿等。本文在研究语音识别理论的基础上,设计并开发了基于词网模型的连续语音识别系统—MYASR。MYASR提供了丰富的功能模块,包括前端处理、特征提取、模型训练、词网构建、识别等,使开发一个基于词网模型的连续语音识别应用系统更加方便,同时也是语音识别研究的实验平台。MYASR所采用的XML描述文件,使系统具有良好的可读性和可扩展性。通过在TIMIT语料库上单音子连续语音识别的实验显示,MYASR具有很高的识别性能和实时性能。  相似文献   

4.
本文介绍了一种基于TMS320C6711 DSP的非特定人、孤立词语音识别系统。本文首先介绍了语音识别技术的基本原理,然后对不同的识别算法在多种嵌入式系统平台上进行性能分析和比较,可得到本语音识别系统具有较高的识别率、实时性和鲁棒性。  相似文献   

5.
汉语语音识别系统评估王仁华,倪晋富(中国科学技术大学合肥230027)关键词语音识别,性能评价,语音数据库1引言汉语语音识别系统评估,是指运用科学的方法和技术手段,来评定不同的识别系统和算法之间的优劣.这项研究对改进和完善现有系统设计,提高系统性能,...  相似文献   

6.
语音识别系统在音频质量较差时,经常出现识别错误的情况,为提高识别精度,基于连续隐马尔科夫模型设计英语翻译机器人语音识别系统。在硬件中,设计音频信号接收器和机器人音频识别模块主处理器。在软件中,对音频信号量化并预加重处理,计算帧移距离与每帧长度之间的比值,获取模拟信号转换频率与基本单位量化指标;基于连续隐马尔可夫模型构建语音文本解编码器,计算窗函数的宽度,在网格中获取马尔科夫链概率路径,比较不同概率路径的复杂度;设计英语翻译机器人语音识别算法,得到英语翻译机器人的语音识别结果。由实验数据可知:该系统在三种不同音频质量下的语音识别准确率均在75%以上,较其他系统更稳定,在同等音频质量下,准确率更高,可见连续隐马尔可夫模型的语音识别系统优于其他系统。  相似文献   

7.
MATLAB环境下的基于HMM模型的语音识别系统   总被引:5,自引:0,他引:5  
在MATLAB环境下利用语音工具箱Voice Box实现基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对20条2~8个字的语音命令进行识别,准确率可达到95%,识别时间1.5~3s,实现了小词汇量连续语音的非特定人的实时识别。  相似文献   

8.
《计算机工程》2018,(1):199-205
为提高普米语语音识别系统的性能,引入深度学习模型进行普米语语音识别,该模型是一个高容量复杂的网络模型。以Kaldi语音识别工具包为实验平台,分别训练5种不同的声学模型,且这5种模型中包含一个有4隐层的深度神经网络模型。比较不同声学模型得到的语音识别率发现,G-DNN模型比Monophone模型的语音识别率平均提升49.8%。实验结果表明,当增加训练集的普米语语音语料量时,基于深度学习的普米语语音识别率会提升,而基于深度学习的普米语语音识别系统的鲁棒性比其余4个声学模型的普米语语音识别系统的鲁棒性更强。  相似文献   

9.
噪音是降低语音识别系统精度的关键因素,因此,如何从带噪语音信号中提取出有效的语音特征是提高语音识别系统识别率的重要途径.该文在分析语音特征提取方法的基础上提出改进算法.实验表明,采用LDA MLLT CMs算法组合提取出的语音特征具有较好的鲁棒性,在噪音环境下的平均音节识别率为43.79%.该组合在中文大词汇量连续语音识别系统中也有较好的性能,音节识别率达到83.56%.  相似文献   

10.
本文主要介绍了连续语音识别系统的构建过程,分析了连续语音识别系统构建的方式和采用音素构建连续语音识别声学模型的基本方法。阐述了利用隐马尔可夫工具包搭建的连续语音识别系统,给出了系统评估方法,系统使用日本标准JNAS数据库进行建模并使用北海道大学日本学生的发音进行实验,验证模型的有效性。  相似文献   

11.
语句级汉字拼音输入技术评估方法的研究   总被引:1,自引:0,他引:1  
该文介绍了语句级汉字拼音输入技术评估方法的研究意义及其重要性。从信息论角度出发,提出了基于损失函数的语句级汉字拼音输入技术的评估方法,它通过损失函数比较经语句级汉字拼音输入系统输出的句子和相应的标准句子,得到描述系统性能的定量指标。该方法对汉字拼音输入技术的音节流自动切分和音字转换两方面进行了较全面的评估。采用手工标注的1996年《人民日报》部分语料,对目前流行的汉字拼音输入技术进行了评估,实验结果表明:拼音输入技术音字转换准确率最高能达到64.3%,音节流自动切分对音字转换的准确率有大约2%的影响。评估结果对今后的拼音输入技术的评估提供了参考价值,对汉字拼音输入技术的持续发展有指导意义。  相似文献   

12.
大规模高质量双语平行语料库是构造高质量统计机器翻译系统的重要基础,但语料库中的噪声影响着统计机器翻译系统的性能,因此有必要对大规模语料库中语料进行筛选。区别于传统的语料选择排序模型,本文提出一种基于分类的平行语料选择方法。通过少数句对特征构造差异较大的分类器训练句对,在该训练句对上使用更多的句对特征对分类器进行训练,然后对其他未分类句对进行分类。相比于基准系统,我们的方法不仅缩减40%训练语料规模,同时在NIST测试数据集合上将BLEU值提高了0.87个百分点。  相似文献   

13.
足球机器人决策系统专用程序设计语言   总被引:1,自引:1,他引:0  
介绍了足球机器人决策系统的结构,详细介绍了RS语言系统的组成和翻译器的工作原理,该语言是以功能部件库为依托,在C 语言子集中引入“RS描述语句”和“装配语句”而形成的,使得程序员可以方便的利用功能部件库中的部件来开发软件,减轻编程难度,提高编程效率。  相似文献   

14.
顺序控制设计法是PLC梯形图的一种先进规范的方法,将其应用于组合机床控制系统中,使控制软件与工序动作有较好的对应关系,编制和调试效率高。与经验设计法相比,软件语句少,扫描时间短,实时性较强。  相似文献   

15.
GridMol系统中蛋白质可视化与建模的性能优化   总被引:1,自引:0,他引:1       下载免费PDF全文
基于网格计算思想开发一个具有计算化学前、后处理功能的系统GridMol,其主要功能包括分子可视化、分子建模和计算作业提交。针对GridMol系统中蛋白质大分子显示和建模遇到的性能问题,给出调整Java 3D场景图进行性能优化的方法,通过GridMol和其他分子可视化软件的性能比较以及自身优化前后的性能比较,证明优化方法取得了良好的效果。  相似文献   

16.
将PLC级式编程技术运用于液压纵横油缸进给加工系统,使控制软件与工序动作有较好的对应关系,编程和调试效率高。与梯形图相比,软件语句少,扫描时间短,实时性较强。  相似文献   

17.
网络模拟软件NS2与OPNET的剖析比较   总被引:1,自引:0,他引:1  
NS2和OPNET是目前主流的网络模拟软件,为深入地剖析比较它们的特点及差别以供学习和选用时参考,从软件技术、使用方法和引擎性能三个方面进行了详细对比分析。在软件技术方面分别从体系结构、支持的网络技术、网络设备模型库和软件可扩展性上进行分析比较;在模拟器引擎性能方面,通过在相同模拟条件下,选取内存消耗和CPU运算时间两个指标,针对不同规模的抽象网络,分别对OPN盯和NS2的引擎性能进行了对比实验。结果表明,OPNET具有商业软件的优势,在用户友好性、模拟速度、内存消耗等方面优于NS2,而NS2则在开源和易扩展性方面优于OPNET,适合于模拟中小型网络。  相似文献   

18.
《Knowledge》2006,19(3):153-163
Spoken dialogue systems can be considered knowledge-based systems designed to interact with users using speech in order to provide information or carry out simple tasks. Current systems are restricted to well-known domains that provide knowledge about the words and sentences the users will likely utter. Basically, these systems rely on an input interface comprised of speech recogniser and semantic analyser, a dialogue manager, and an output interface comprised of response generator and speech synthesiser. As an attempt to enhance the performance of the input interface, this paper proposes a technique based on a new type of speech recogniser comprised of two modules. The first one is a standard speech recogniser that receives the sentence uttered by the user and generates a graph of words. The second module analyses the graph and produces the recognised sentence using the context knowledge provided by the current prompt of the system. We evaluated the performance of two input interfaces working in a previously developed dialogue system: the original interface of the system and a new one that features the proposed technique. The experimental results show that when the sentences uttered by the users are out-of-context analysed by the new interface, the word accuracy and sentence understanding rates increase by 93.71 and 77.42% absolute, respectively, regarding the original interface. The price to pay for this clear enhancement is a little reduction in the scores when the new interface analyses sentences in-context, as they decrease by 2.05 and 3.41% absolute, respectively, in comparison with the original interface. Given that in real dialogues sentences may be out-of-context analysed, specially when they are uttered by inexperienced users, the technique can be very useful to enhance the system performance.  相似文献   

19.
张曼  李弼程  林琛 《计算机工程》2008,34(11):270-272
在邮件服务端和邮件客户端,重复邮件浪费了大量资源。该文提出一种基于SHA-1的邮件去重算法,将邮件按大小分开处理,根据Hash值快速去除正文相同或相似的重复邮件。实验结果表明了该算法的有效性,其运行速度比传统方法快。  相似文献   

20.
Open Information Extraction (OIE) systems focus on identifying and extracting general relations from text. Most OIE systems utilize simple linguistic structure, such as part-of-speech or dependency features, to extract relations and arguments from a sentence. These approaches are simple and fast to implement, but suffer from two main drawbacks: i) they are less effective to handle complex sentences with multiple relations and shared arguments, and ii) they tend to extract overly-specific relations.This paper proposes an approach to Information Extraction called SemIE, which addresses both drawbacks. SemIE identifies significant relations from domain-specific text by utilizing a semantic structure that describes the domain of discourse. SemIE exploits the predicate-argument structure of a text, which is able to handle complex sentences. The semantics of the arguments are explicitly specified by mapping them to relevant concepts in the semantic structure.SemIE uses a semi-supervised learning approach to bootstrap training examples that cover all relations expressed in the semantic structure. SemIE inputs pairs of structured documents and uses a Greedy Mapping module to bootstrap a full set of training examples. The training examples are then used to learn the extraction and mapping rules.We evaluated the performance of SemIE by comparing it with OLLIE, a state-of-the-art OIE system. We tested SemIE and OLLIE on the task of extracting relations from text in the “movie” domain and found that on average, SemIE outperforms OLLIE. Furthermore, we also examined how the performance varies with sentence complexity and sentence length. The results prove the effectiveness of SemIE in handling complex sentences.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号