期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郭罡李锦宇李小兵刘波王仁华《信号处理》2004,20(5):525-528

当今语音识别技术的一个重要应用就是嵌入式平台上的命令词识别系统,本文提出了一种新的组合解码和置信度的一遍解码方法,同时在算法高精度、运算低复杂度两方面做出了很大的努力,最终在PDA(Compaq iPAQ 3630)平台上实现了一个基于HMM的定点命令词语音识别系统。系统具有较强的鲁棒性和集外词拒识能力,而且系统也具有完整性、高精度、低运算复杂度,整体设计框架灵活,可以非常容易的移植到各种嵌入式平台。相似文献

2.

邮包校核语音识别系统的实时实现 总被引：6，自引：0，他引：6

下载免费PDF全文

单翼翔张昊天李虎生钟林张进刘加刘润生《电子学报》2002,30(4):544-547

本文研究开发了一套邮包信息校核语音识别系统.该系统利用中大词汇量非特定人连续语音识别技术实时实现了邮包信息的语音校核.系统可以识别普通话或四川话语音,可识别的词汇量约为4500条.系统还采用了拒识技术与说话人自适应技术,提高了整个系统的稳健性.实验表明对普通话的首选识别率达到98.7%,前三选识别率达到99.9%.对四川话的首选识别率达到95.9%,前三选识别率达到98.6%,对无关语音的正确拒识率达到85%,对口音较重的说话人经过自适应后识别率可提高5－8个百分点. 相似文献

3.

基于支持向量机的关键词拒识算法

张搏刘金福张昆帆《现代电子技术》2006,29(12):126-129

支持向量机是统计理论学习中一个重要的学习方法，也是解决模式识别问题的强有力工具，尤其在二元分类上有着突出的优势。拒识技术是语音识别系统走向实用化的关键技术之一，但由于语音信号的复杂性，使得拒识一直是语音识别技术中的难题。有机的将支持向量机技术应用于关键词识别的拒识问题中，把关键词识别中的正识和误识作为支持向量机的二元分类对象。这种方法避免了传统拒识方法对拒识门限的确定，同时充分发挥了支持向量机在二元分类上的优势。实验表明该算法效果较为有效。相似文献

4.

高性能汉语数码串语音识别 总被引：9，自引：0，他引：9

下载免费PDF全文

李虎生刘加刘润生《电子学报》2001,29(5):595-599

本文给出了一个高性能汉语数码串非特定人连续语音识别系统,其声学模型基于Mel倒谱系数和连续HMM,识别时采用多候选帧同步搜索算法,并采用了MCE算法进行训练以提高系统的区分能力,实验证明该系统的识别率为94.8%(不定长数字串)和96.8%(定长数字串).为增强系统的实用性,本文还研究了基于MAP算法的说话人自适应算法和基于置信度的拒识算法.在进行自适应后,误识率可相对下降40%以上,在拒绝掉5%的正确语音时,系统识别率可以上升到96.9%(不定长数字串)和98.7%(定长数字串). 相似文献

5.

基于嵌入式系统的语音口令识别系统的实现

王大巍《电子技术》2010,47(7):21-22

语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。相似文献

6.

小词汇量非特定人的语音识别系统

赵彦敏张妍赵宇杰《无线互联科技》2012,(10):51-51

设计了一种基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对10条2～4个字的语音命令进行识别,准确率可达到90%,识别时间1.5～3s。相似文献

7.

基于语音的身份识别系统的数字的区分度算法

《科技展望》2015,(32)

文本相关重点研究的说话人语音识别是语音识别研究中的一个重要分支。本论文介绍了一种采用特征空间轨迹匹配方式的基于数字语音的身份识别系统的设计方法。并针对"0"到"9"这十个数字,对不同说话人的语音特征的可区分性进行了探讨,提出了数字区分度算法,以便找出最能有效区分不同说话人的数字,进而在识别系统中提高识别效率。实验结果表明,本论文提出的数字区分度算法在小规模语音说话人集合中得到了验证。相似文献

8.

分布式语音识别系统的架构分析和具体实现

孟建庭吴及王作英《电声技术》2004,(8):51-53

研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端／服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到稳定高效的性能。相似文献

9.

电话语音识别中基于统计模型的动态通道

韩兆兵张化云张树武徐波《电子与信息学报》2004,26(11):1714-1720

与桌面环境相比,电话网络环境下的语音识别率仍然还比较低,为了推动电话语音识别在实际中的应用,提高其识别率成了当务之急．先前的研究表明,电话语音识别率明显下降通常是因为测试和训练环境的电话通道不同引起数据失配造成的,因此该文提出基于统计模型的动态通道补偿算法（SMDC)减少它们之间的差异,采用贝叶斯估计算法动态地跟踪电话通道的时变特性．实验结果表明,大词汇量连续语音识别的字误识率(CER)相对降低约27％,孤立词的词误识率(WER)相对降低约30％．同时,算法的结构时延和计算复杂度也比较小．平均时延约200ms．可以很好地嵌入到实际电话语音识别应用中．相似文献

10.

基于Windows CE的语音口令识别系统的设计

王大巍《电子技术》2010,37(11):40-41

论文给出一种基于嵌入式系统的语音口令识别系统的设计方案,该系统的硬件电路由嵌入式微处理器和音频处理等主要芯片组成,采用Windows CE操作系统,语音口令识别算法为连续隐马尔可夫模型。实验结果表明,随着嵌入式微处理器性能的不断提高和价格的不断下降,对运算量要求比较高的语音口令识别技术就可以通过嵌入式系统来实现,并且应用到许多需要使用口令控制的便携式设备中。相似文献

11.

基于音素的非特定人英语命令词识别算法研究 总被引：2，自引：0，他引：2

贲俊余小清万旺根《信号处理》2002,18(6):535-538

本文提出了一种新的基于音素的非特定人英语命令词识别算法,并在此算法基础上构建了一个非特定人英语命令词识别系统。结合非特定人语音识别系统的特点,系统的实现采用了HTK与VisualC++两种工具混和使用,提高了整个系统的开发效率。在识别阶段将置信度评估和不完全匹配的方法结合在一起,在一定程度上提高了识别的质量,在词汇量大于10的情况下取得了87.8％的识别率。相似文献

12.

应用于语音识别片上系统的语音检测算法 总被引：2，自引：0，他引：2

梁维谦许海国陈一宁刘加刘润生《电路与系统学报》2003,8(2):66-70,79

语音识别技术的研究已经进入实用化阶段，而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程，分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统，通过实验验证了其对系统识别性能和噪声稳健性的有效保证。相似文献

13.

基于VEMAP的说话人识别鲁棒性研究

黄文娜彭亚雄《电声技术》2016,40(11):44-47

为了改善发声力度变化对说话人识别系统性能的影响.针对不同发声力度下语音信号的分析,提出了使用发声力度最大后验概率(Vocal Effort Maximum A Posteriori,VEMAP)自适应方法更新基于高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)的说话人识别系统模型.实验表明,所提出的方法使不同发声力度下系统EER％降低了88.45％与85.16％,有效解决了因发声力度变化引起的训练语音与测试语音音量失配,从而导致说话人识别性能降低的问题,改善说话人识别系统性能效果显著. 相似文献

14.

非齐次语音识别HMM模型和THED语音识别与理解系统

王作英《电信科学》1993,(4)

本文从语音状态驻留长度分布出发,建立了一个非齐次隐含马尔可夫(Markov)语音识别模型。这个模型更接近语音信号物理实际,训练和识别的时间、空间复杂性比经典的HMM模型有很大的改进。文中描述了新模型的训练和识别算法,介绍了根据这一模型所设计的一个汉语孤立字全字表的实时识别和理解系统。相似文献

15.

An Improved Endpoint Detection Algorithm Based on MFCC Cosine Value

Danyang Cao Xue Gao Lei Gao 《Wireless Personal Communications》2017,95(3):2073-2090

Endpoint detection is one of the most important steps in speech recognition. In a high SNR environment, the algorithm based on short-time energy and zero rate could be used. But when the SNR is low, this method may not be accurate. Some researchers proposed an algorithm which is based on MFCC Euclidean distance. It has a better performance in a noise environment. But that algorithm needs two thresholds to find the start and end point. However, when the values of two thresholds are not suitable, the detected result could be extremely bad. In this paper, we proposed an improved algorithm which is based on MFCC cosine value. This method can reduce errors, since it only needs one single threshold. The benefit of this improved algorithm is that the result can surely contain the real voice component. According to the experiment data, this improved algorithm can improve the speech recognition rate by 10% even in noise environment (SNR = 0). Thus, it proved that this improved methods has better robustness. 相似文献

16.

A low-power integrated circuit for remote speech recognition

Borgatti M. Felici M. Ferrari A. Guerrieri R. 《Solid-State Circuits, IEEE Journal of》1998,33(7):1082-1089

In this paper, a low-power, low-voltage speech processing system is presented. The system is intended to he used in remote speech recognition applications where feature extraction is performed on terminal and high-complexity recognition tasks and moved to a remote server accessed through a radio link. The proposed system is based on a CMOS feature extraction chip for speech recognition that computes 15 cepstrum parameters, each 8 ms, and dissipates 30 μW at 0.9-V supply. Single-cell battery operation is achieved. Processing relies on a novel feature extraction algorithm using 1-bit A/D conversion of the input speech signal. The chip has been implemented as a gate array in a standard 0.5-μm, three-metal CMOS technology. The average energy required to process a single word of the TI46 speech corpus is 10 μJ. It achieves recognition rates over 98% in isolated-word speech recognition tasks 相似文献

17.

汉语连续语音识别结果评价算法研究

下载免费PDF全文

刘刚陈伟郭军《中国通信》2010,7(2):132-138

在汉语语音识别中,由于汉语构词的特点,使得基于词的汉语语音识别结果评价不准确。论文对于传统连续语音识别结果评价算法进行了改进,提出了一种基于字词混合的汉语连续语音识别结果评价算法,可以有效完成基于词的识别结果评价,同时也将识别结果评价由四种情况(正确、替代、插入、删除)扩展到六种情况(增加了插入式替代和删除式替代),可以为语音识别的后处理提供更多有用的信息。实验表明,本文所提算法可以有效降低传统评价算法带来的虚假错相似文献

18.

语音信号互信息估计的非线性搜索算法及识别应用 总被引：6，自引：0，他引：6

俞一彪赵鹤鸣周旭东《信号处理》2002,18(2):102-106

基于互信息理论的语音识别方法不仅考虑了语音信号的时变分布特征，并且考虑了语音信号的统计分布特征，能有效地提高同类模式的凝聚度，减少非同类模式间的耦合性，在语音识别实验和实际应用中反映出良好的识别精度和很高的运行效率，与其它方法相比更适合嵌入式系统的语音识别应用。本文提出了一种互信息估计的非线性搜索算法，这一算法能够有效地处理语音信号时变分布特征的非线性波动，进一步提高语音模式互信息匹配的精度。相似文献

19.

语音识别片上系统中的多级搜索算法 总被引：7，自引：0，他引：7

下载免费PDF全文

朱璇陈一宁刘加刘润生《电子学报》2004,32(1):150-153

本文提出了一种新的用于片上的语音识别多级搜索算法.该算法以连续隐含马尔可夫模型(Continuous Density HMM,CDHMM)为基本识别框架.在保证识别率基本不变的前提下,大大降低了片内存储空间的占用量,减少了识别搜索时间.在第二级识别候选词条的选取准则上,提出一种基于置信度的选择方法,更进一步改善了识别速度,增强了识别的稳健性.在200个语音命令的识别任务下,系统的识别率为98.83％.而当识别词条增加到600条时,该算法也具有良好的识别性能. 相似文献

20.

改进的高效动态时间规整算法语音识别系统

王新胜巩捷甫喻明艳《太赫兹科学与电子信息学报》2015,13(6):942-946

动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。相似文献