首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
介绍应用于“虎丘,,旅游服务的非特定人语音对话系统.该系统运用互信息匹配模型MIM进行音节识别,并提出了关键词句法模型及相应的分析算法KBP进行语句分析和识别.实验表明,互信息匹配模型MIM的应用使连续语音音节识别率达到78%,而关键词句法分析的运用使系统总体语句识别率提高了65%,而且对预处理部分音节分割的误差以及不规范的语句输入有较好的容错处理能力.  相似文献   

2.
针对当前关键词识别少资源或零资源场景下的要求, 提出一种基于音频自动分割技术和深度神经网络的关键词识别算法. 首先采用一种基于度量距离的改进型语音分割算法, 将连续语音流分割成孤立音节, 再将音节细分成和音素状态联系的短时音频片段, 分割后的音频片段具有段间特征差异大, 段内特征方差小的特点. 接着利用一种改进的矢量量化方法对音频片段的状态特征进行编码, 实现了关键词集内词的高精度量化编码和集外词的低精度量化编码. 最后以音节为识别单位, 采用压缩的状态转移矩阵作为音节的整体特征, 送入深度神经网络进行语音识别. 仿真结果表明, 该算法能从自然语音流中较为准确地识别出多个特定关键词, 算法易于理解、训练简便, 且具有较好的鲁棒性.  相似文献   

3.
针对汉语语音识别中协同发音现象引起的语音信号的易变性,提出一种基于音节的声学建模方法。首先建立基于音节的声学模型以解决音节内部声韵母之间的音变现象,并提出以音节内双音子模型来初始化基于音节声学模型的参数以缓解训练数据稀疏的问题;然后引入音节之间的过渡模型来处理音节之间的协同发音问题。在“863-test”测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了12.13%,表明了基于音节的声学模型和音节间过渡模型相结合在解决汉语协同发音问题上的有效性。  相似文献   

4.
基于码书关联网络的基音调制信息隐藏检测   总被引:2,自引:0,他引:2  
基音调制信息隐藏在进行基音预测时嵌入机密信息,可在低速率语音压缩编码过程中进行高隐蔽性的信息隐藏,文中试图对该种隐写进行检测.文中发现该种隐写将导致压缩语音流中相邻语音帧自适应码书的关联特性发生改变,文中以此为设计隐写分析算法的关键线索.为了量化该种关联特性,文中设计了码书关联网络模型并基于该模型得到了对隐写敏感的特征向量.最后,基于所得特征向量并结合SVM(Support Vector Machine,支持向量机)构建了隐写检测器.针对典型的低速率语音编码标准G.729以及G.723.1的实验表明,文中方法性能优于现有检测方法,实现了对基音调制信息隐藏的快速有效检测.  相似文献   

5.
以降低码率为目的对G.728算法进行改进,提出了一个延迟为2.5 ms的8 Kbit/s的语音编码算法。算法引入了由最近的历史激励构成的自适应码书和归一化的固定码书的双码书结构。计算增益真值并量化,增益量化时对自适应码书用固定量化,固定码书用自适应量化。码书搜索时先进行后向基音检测,在基音周期T附近对自适应码书进行精细搜索。搜索64个自适应码矢、256个固定码矢和各自8个增益值获得最佳激励,每帧耗费20 bit。用平均分段信噪比和感知语音质量评价(PESQ)测试,改进算法编码质量接近于G.728。  相似文献   

6.
不同的汉语语音关键阋识别系统,以关键词为单位建立模板工作量大而且可重用性较差,而以音节为单位可以很好地提高重用性。将弹性音节拼接与具有较高性能的基于特征空间轨迹匹配的关键词检测相结合构建识别系统,实验结果表明该系统具有相当高的识别率。  相似文献   

7.
针对离散隐马尔可夫(Discrete Hidden Markov Model,DHMM)语音识别系统中LBG算法对初始码书的依赖性和易陷入局部最优解的问题,采用人工蜂群(Artificial Bee Colony,ABC)算法对语音特征参数进行矢量量化,从而得到最优码书,提出了ABC改进DHMM的孤立词语音识别方法。先提取语音信号的特征参数,然后用ABC算法中每个食物源表示一个码书,以人工蜂群进化的方式对初始码书进行迭代而获得最优码书,最后把最优码书的码矢标号代入DHMM模型进行训练和识别。实验结果表明,ABC改进的DHMM语音识别方法与传统的LBG及粒子群优化初始码书的LBG的DHMM语音识别方法相比具有较高的识别率和较好的鲁棒性。  相似文献   

8.
在矢量量化的码书设计过程中,针对传统的LBG算法对初始码书选取的依赖性及易陷入局部最优的缺陷,提出基于免疫猫群优化算法的矢量量化码书设计.将整个种群分为搜索组和跟踪组,运用克隆扩增算子在搜寻组中进行局部搜索,根据适应度值大小调节变异个体数目,保持解的多样性.运用动态疫苗提取与接种算子使跟踪组个体基因与疫苗进行交叉变异,向最优解靠拢,防止无监督交叉变异可能引起的退化现象.通过浓度平衡算子和选择算子更新子代种群,防止种群"早熟".将训练出全局最优码书输入到HMM模型进行训练和识别,实验结果表明,基于免疫猫群优化算法的矢量量化码书设计不依赖于初始码书选取,鲁棒性强且降低语音识别误差率.  相似文献   

9.
汉语连续语音识别系统与知识导引的搜索策略研究   总被引:1,自引:0,他引:1  
从整体上介绍了汉语连续语音识别系统的基本原理,并重点对声学和语言两个层面 的建模与搜索策略进行了分析.在对传统帧同步搜索算法进行研究的基础上,提出了基于统 计知识的帧同步搜索算法SKB-FSS.它包含了三个主要的功能层次:基于归并的音节切分自 动机产生确定的搜索边界点,由统计得到的差分状态驻留信息控制搜索过程中的状态转移, 利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径 剪枝.实验结果验证了该搜索策略的有效性.  相似文献   

10.
石峰  秦敏  李治柱 《计算机工程》2004,30(9):157-158
针对不确定的汉语语音关键词识别系统,为每个关键词分别建立模型是非常烦琐的,采用音节作为次词具有很好的灵活性。通过同传统的关键词识别系统作比较后发现用音节作为次词的系统具有相当高的识别率,其运算效率也非常高。  相似文献   

11.
基于分布特征统计的说话人识别   总被引:2,自引:2,他引:0       下载免费PDF全文
给出了基于公共码书的说话人分布特征的定义。提出了基于分布特征统计的说话人识别算法,根据所有参考说话人的训练语音建立公共码书,实现对语音特征空间的分类,统计各参考说话人训练语音的在公共码字上的分布特征进行建模。识别中引入双序列比对方法进行识别语音的分布特征统计与参考说话人模型间的相似度匹配,实现对说话人的辨认。实验表明,该方法保证识别率的情况下,进一步提高了基于VQ的说话人识别的速度。  相似文献   

12.
关键词识别是语音识别中的一个重要研究方向,而维吾尔语的关键词识别研究刚刚开始。结合维吾尔语音节特点和考虑影响关键词识别因素,提出在HMM模型的基础上对非关键词建立垃圾模型的方法,来提高关键词的识别效率。  相似文献   

13.
关键词识别是语音识别中的一个重要研究方向,而维吾尔语的关键词识别研究刚刚开始.结合维吾尔语音节特点和考虑影响关键词识别因素,提出在HMM模型的基础上对非关键词建立垃圾模型的方法,来提高关键词的识别效率。  相似文献   

14.
利用HMM嵌入训练方法建立汉语电话连续语音声学模型   总被引:2,自引:0,他引:2  
文章介绍了用HMM嵌入训练方法来建立连续语音的声学模型,并对基于音素的HMM和基于音节的HMM进行了比较,并以此为基础建立了一个实用的银行电话语音服务系统。  相似文献   

15.
拼写检查作为文本处理中的重要内容,在字处理软件、文字识别、语音识别、搜索引擎等领域具有广泛的应用。该文以藏文语音特性建立的字组织法为依据,以藏文音节规则为模型,提出了藏文音节规则模型(TSRM)的藏文音节拼写检查算法,并通过2组实验验证了算法的有效性。在没有考虑梵音转写藏文的情况下,拼写错误检查的准确率可以达到99.8%。  相似文献   

16.
本文提出了一种基于帧间相关特性的连续语音流的音节切分方法,采用反映相邻帧间LPC系数相关程度的帧间相关特性及其参数,进行连续语音流的分段切分,并通过时域参数对切分出的各个语音段进行音索性质标记,再根据汉语音节组成规则最后确定出音节切分及其边界.汉语数字串语音流的音节切分实验表明了该方法的有效性.  相似文献   

17.
设计了一种腭裂语音的声韵母切分算法。通过主观的波形测试和客观的F检验及t检验,证明了腭裂语音与正常语音具有显著性差异。定义声母具有清音音素特性的音节为I类音节,声母具有浊音音素特性的音节为II类音节。首先基于层次聚类模型自动判别I类、II类音节,然后定义类浊音权重函数和类清音概率函数,实现I类音节的声韵母一级切分,再通过短时自相关函数峰值个数的一阶微分实现I类音节声韵母的二级切分。基于声韵母波形差异性,检测短时自相关函数的能量跳变点,实现II类音节的声韵母切分。通过大样本实验,结果表明提出的腭裂语音声韵母自动判别算法具有较高的正确率,I类音节的正确率达到90.72%,II类音节的正确率为92.90%。  相似文献   

18.
基于HMM的关键词识别系统   总被引:4,自引:0,他引:4  
关键词识别是语音识别中一个重要的研究方向.该文提出了一种基于HMM模型的关键词识别方法.研究并实现了一种新的具有无废料模型精度的采用迭代viterbi的解码算法,从而提高了关键词系统的识别效率.  相似文献   

19.
提出一种应用于体育节目音频分析中的关键词检索系统框架,并利用关键词检索结果对比赛实现了体育类别的自动判断.采用一种基于距离测算和基于模型选择融合的前端音频处理模块,实现了对复杂音频流中语音的高效提取;采用基于LVCSR系统的关键词系统框架,利用少量体育节目语音数据,对声学模型进行了自适应,构建体育类语言模型同时提出一种针对特定关键词词频分布的语言模型自适应,较大幅度提高了关键词系统的检出性能;针对不同体育比赛选择特征关键词,并利用关键词系统检索结果实现了比赛类别的自动判定,在由七种体育共15场比赛构成的测试集中,判定正确率达到100%.  相似文献   

20.
为了降低代数码激励线性预测(algebraic code-excited linear prediction, ACELP)语音编码算法的复杂度, 以便更好地实时实现, 提出了一种有效的改进算法。在自适应码书搜索上提出了不连续的开环基音搜索算法, 利用时间抽取因子对不同时延段语音样点进行不连续抽取; 在代数码书的搜索上提出了一致脉冲替换法, 采用脉冲位置预选和循环判断机制控制码书搜索的次数。以G. 729A为实验平台进行仿真, 仿真结果表明, 改进的算法在保证语音质量的情况下, 有效降低了ACELP码书搜索的复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号