首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 139 毫秒
1.
本文介绍了一个在微机上实现的汉语连续单词语音识别系统。它采用了分级动态规划算法的基本思想。文章首先介绍了动态规划算法和分级动态规划算法。然后讨论了将其用于汉语连续数字串识别的一些实际问题。系统识别长度为3的汉语数字串,平均识别率为90.9%。对长度为2的数字串,识别率可达98.5%。  相似文献   

2.
针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进。在英国科幻电视剧“神秘博士”数据集合上的实验结果表明,提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能,不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题,还能对相应的大段连续文本标注进行分段,保证分割后各语音段时间标签及其对应文本的准确性。  相似文献   

3.
为提高现有小波去噪法的处理效果,准确有效判断出连续语音中各个音节的起止点,提出了基于分形理论的算法。该算法首先利用分形维与小波变换相结合的动态阈值算法进行语音去噪,从而提取出尽可能纯净的语音信号;在此基础上,计算分形维轨线,根据其均值对音节分割点进行判定。实验结果表明,该算法较好地实现了语音去噪和音节分割,鲁棒性较好,使得系统在低信噪比情况下仍保持较高准确率,在语音识别方面有较好应用前景。  相似文献   

4.
对利用基因算法训练连续隐马尔柯夫模型的语音识别的具体算法进行系统的研究;然后基于该语音识别技术对深圳市司法局社区矫正声纹识别系统进行详细设计。该系统上线后的运行结果表明,利用基因算法训练连续隐马尔柯夫模型的语音识别算法的识别速度较快同时具有较高的识别率。基于模式识别技术的司法社区矫正声纹识别系统建设在我国司法系统目前尚处于起步阶段,推广和建设司法社区矫正声纹识别系统具有重要的现实意义。  相似文献   

5.
首先,本文提出了采用原始结构的上下文知识对非限制手写体数字串进行分割和识别。开发的新算法在数字串图像中确定特征点,以产生可能的分割假设。一种原始的识别图表利用分割假设的空间。分割假设的估算采用新颖的评价图表,以改善系统的分离物阻割。文中的原始算法试图通过搜索来获取分割假设的总数,并寻找最高的分割/识别可信度。NIST NSTRING SD19和CENPARMI数据库用作估算本方法。实验显示,在分割中采用适当的上下文知识可以极大地改善系统的特性。在手写体数字串中,采用神经网络和支持向量机分类器,我们的系统可分别获取95.28%和96.42%的正确识别率。  相似文献   

6.
汉语连续数字串语音识别系统   总被引:1,自引:2,他引:1  
汉语数字串在语音识别中具有重要的地位,文章设计实现了一个实用化的汉语连续数字串语音识别系统,并针对汉语数字混淆度大的特点进行了分析,提出了模型改进和语速控制策略,使系统具有很好的整体性能。  相似文献   

7.
一种无约束手写体数字串分割方法   总被引:11,自引:1,他引:11  
针对无约束手写体数字串中的连笔字符,本文提出以基于识别的分割方法为主,结合运用剖分方法和全局识别方法等多种分割策略的数字串分割方法。这种方法直接针对数字串分割,也可以运用到非数字字符串的分割中,其分割思想对连笔汉字的分割也具有一定指导意义。  相似文献   

8.
近年来,由于动态贝叶斯网络(DBN)相对于传统的隐马尔可夫模型(HMM)更具可解释性、可分解性以及可扩展性,基于DBN的语音识别引起学者们越来越多的关注.但是,目前关于基于DBN的语音识别的研究主要集中在孤立语音识别上,连续语音识别的框架和识别算法还远没有HMM成熟和灵活.为了解决基于DBN的连续语音识别的灵活性和可扩展性,将在基于HMM的连续语音识别中很好地解决了上述问题的Token传递模型加以修改,使之适用于DBN.在该模型基础上,为基于DBN的连续语音识别提出了一个基本框架,并在此框架下提出了一个新的独立于上层语言模型的识别算法.还介绍了作者开发的一套基于该框架的可用于连续语音识别及其他时序系统的工具包DTK.  相似文献   

9.
针对当前关键词识别少资源或零资源场景下的要求, 提出一种基于音频自动分割技术和深度神经网络的关键词识别算法. 首先采用一种基于度量距离的改进型语音分割算法, 将连续语音流分割成孤立音节, 再将音节细分成和音素状态联系的短时音频片段, 分割后的音频片段具有段间特征差异大, 段内特征方差小的特点. 接着利用一种改进的矢量量化方法对音频片段的状态特征进行编码, 实现了关键词集内词的高精度量化编码和集外词的低精度量化编码. 最后以音节为识别单位, 采用压缩的状态转移矩阵作为音节的整体特征, 送入深度神经网络进行语音识别. 仿真结果表明, 该算法能从自然语音流中较为准确地识别出多个特定关键词, 算法易于理解、训练简便, 且具有较好的鲁棒性.  相似文献   

10.
介绍应用于“虎丘,,旅游服务的非特定人语音对话系统.该系统运用互信息匹配模型MIM进行音节识别,并提出了关键词句法模型及相应的分析算法KBP进行语句分析和识别.实验表明,互信息匹配模型MIM的应用使连续语音音节识别率达到78%,而关键词句法分析的运用使系统总体语句识别率提高了65%,而且对预处理部分音节分割的误差以及不规范的语句输入有较好的容错处理能力.  相似文献   

11.
This paper presents an original hybrid MLP-SVM method for unconstrained handwritten digits recognition. Specialized Support Vector Machines (SVMs) are introduced to improve significantly the multilayer perceptron (MLP) performance in local areas around the separating surfaces between each pair of digit classes, in the input pattern space. This hybrid architecture is based on the idea that the correct digit class almost systematically belongs to the two maximum MLP outputs and that some pairs of digit classes constitute the majority of MLP substitutions (errors). Specialized local SVMs are introduced to detect the correct class among these two classification hypotheses. The hybrid MLP-SVM recognizer achieves a recognition rate of 98.01%98.01\% , for real mail zipcode digits recognition task. By introducing a rejection mechanism based on the distances provided by the local SVMs, the error/reject trade-off performance of our recognition system is better than several classifiers reported in recent research.  相似文献   

12.
In this paper we investigated Artificial Neural Networks (ANN) based Automatic Speech Recognition (ASR) by using limited Arabic vocabulary corpora. These limited Arabic vocabulary subsets are digits and vowels carried by specific carrier words. In addition to this, Hidden Markov Model (HMM) based ASR systems are designed and compared to two ANN based systems, namely Multilayer Perceptron (MLP) and recurrent architectures, by using the same corpora. All systems are isolated word speech recognizers. The ANN based recognition system achieved 99.5% correct digit recognition. On the other hand, the HMM based recognition system achieved 98.1% correct digit recognition. With vowels carrier words, the MLP and recurrent ANN based recognition systems achieved 92.13% and 98.06, respectively, correct vowel recognition; but the HMM based recognition system achieved 91.6% correct vowel recognition.  相似文献   

13.
自由手写体的识别是模式识别的一个重要课题,该文论述了一个面向具体应用领域的集数据表格的描扫、识别、数据自动入库为一体的软件系统,研究了数字的切分、快速识别等关键技术。采用了一种基于笔道方向的手写体数字识别的方法。  相似文献   

14.
于国防  王莉 《计算机工程》2010,36(7):182-184
针对动态数字图像的识别问题,提出基于二级复合链码的七段数字识别方法。对细化后的目标图像进行第1级8方向Freeman链码描述,在此基础上,进行第2级4方向Freeman链码描述,得到的复合链码与七段数字具有单一映射关系。在无线瓦斯检测系统中的应用结果表明,该方法具有较高的识别率和执行效率。  相似文献   

15.
提出了一种改进的模板匹配的数字识别算法,该算法是预先将字符分成若干个集合,经细化得到数字中央的骨骼部分,再对待识别数字提取特征并与训练库中的数字特征加权比较,利用欧式距离最小原则来对数字作出判决,试验结果表明,加权的模板匹配法保证了数字识别的正确率,而对数字进行预分类和细化处理,可以大大缩小模板匹配的识别速度,弥补了模板匹配算法对于大量数字耗时多的缺点,提升了系统速度。  相似文献   

16.
The recognition of connected handwritten digit strings is a challenging task due mainly to two problems: poor character segmentation and unreliable isolated character recognition. The authors first present a rational B-spline representation of digit templates based on Pixel-to-Boundary Distance (PBD) maps. We then present a neural network approach to extract B-spline PBD templates and an evolutionary algorithm to optimize these templates. In total, 1000 templates (100 templates for each of 10 classes) were extracted from and optimized on 10426 training samples from the NIST Special Database 3. By using these templates, a nearest neighbor classifier can successfully reject 90.7 percent of nondigit patterns while achieving a 96.4 percent correct classification of isolated test digits. When our classifier is applied to the recognition of 4958 connected handwritten digit strings (4555 2-digit, 355 3-digit, and 48 4-digit strings) from the NIST Special Database 3 with a dynamic programming approach, it has a correct classification rate of 82.4 percent with a rejection rate of as low as 0.85 percent. Our classifier compares favorably in terms of correct classification rate and robustness with other classifiers that are tested  相似文献   

17.
This paper proposes a method to recognize digits in a natural scene, such as telephone numbers on a signboard. Candidate regions of digits are extracted from an image through contrast enhancement, edge extraction, and labeling. Since the target text patterns are in a 3D space, unlike traditional character recognition problems, we have to deal with the image transformation effect due to the orientation in the 3D space and projection. We have to cancel the effect as much as possible before digit recognition. In our method, the image transformation effect is modeled as skew and slant. In the proposed method, simplified Hough transform is used for the skew normalization. After the skew normalization, the remaining effect of image transformation is corrected by circumscribing digit patterns with tilted rectangles and affine transformation. In experiments, we tested a total of 1,332 images of signboards with 11,939 digits. We obtained a digit extraction rate of 99.2% and a correct digit recognition rate of 98.8%.Received: 15 December 2003, Accepted: 21 October 2004, Published online: 2 February 2005  相似文献   

18.
自由手写体因其书写风格差异大、上下文无关及识别准确度要求高等原因导致其识别难度大的问题。针对手写体数字识别的特点及要求,提出一种新的基于组合结构特征的自由手写体数字识别算法。通过扩展的字符结构特征识别算法自动、鲁棒地提取手写体数字字符端点、分叉点、横线等多种结构特征,并组合应用这些结构特征构造决策树完成手写体字符的自动识别。实验结果表明基于组合结构特征的自由手写体数字识别算法的鲁棒性和识别率明显优于传统方法。  相似文献   

19.
对模糊C-均值聚类作了简要分析和评论,在此基础上将模拟退火机制引入其中,以克服模糊C-均值聚类的局部性和对初始聚类中心的敏感性;采用了基于贴近度和择近原则的模糊识别方法;详细设计了算法。仿真结果说明,该方法在识别速度和准确率方面都达到了令人满意的效果,为手写体数字的识别提供了一种新方法,也拓展了模糊理论的应用范围。  相似文献   

20.
高性能汉语数码串快速识别算法的研究   总被引:4,自引:0,他引:4  
为了提高非特定人汉语数码串连续语音识别系统的识别速度 ,对系统进行了细致的研究 ,有针对性地提出了一种新的快速识别算法 .通过对隐含马尔可夫模型输出概率密度函数运算的简化 ,以及采用结合段长信息的束搜索剪枝算法 ,在保证识别精度的情况下 ,使识别系统对不定长数码串平均识别时间从 0 .92 s减少为 0 .11s,而串识别正确率仅从 94.3%下降到 94.0 % ,大大地提高了系统的整体性能  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号