首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文针对语音取证中相同采样率的语音拼接识别进行了初步研究,着重分析了拼接对噪声特征的影响,提出了基于分数倒谱变换的拼接帧检测算法,并提出了语音拼接联合识别模型。实验结果表明,在分数阶因子 为0.2时,分数倒谱变换的拼接帧过零率检测算法优于普通倒谱域方差法,在分数阶因子 为1.2时,分数倒谱变换的拼接帧高频方差检测算法优于普通倒谱域方差法。该方案在语音取证领域具有较高的应用价值和广阔的应用前景。  相似文献   

2.
对于当前广泛使用的计算机语音通信,通常的语音捕获方法要么只能针对某个软件有效,要么只能捕获到单向的语音数据。本文对当前的各种语音捕获方法进行了分析,结合对Windows音频组件的研究,提出了一种基于声卡过滤驱动来实现对各种语音通信软件的双向语音数据捕获的方法。  相似文献   

3.
计算机能听懂人的语言,这意味着人工智能时代已向我们走来c北京中自汉王科技公司在IBM支持下,基于ViaVoice自行开发的一种最新语音识别软件与手写输入系统——汉王听写系统,它把IBM研究开发的语音识别核心技术与汉三优秀的手写汉字识别输入系统完美的集成在一起.形成了一个优势互补的非键盘输入系统。成为一种简单方便,人人会用的文字录入工具。这不仅提高了汉字输入速度,而且使讲话人更自然、更流畅地表达自己的意愿。汉王听写系统,具有汉语语音听写输入、语音命令、编辑、打印功能,基于中文自身的特点,同音字多,有声调、词…  相似文献   

4.
维吾尔语音节语音识别与识别基元的研究   总被引:1,自引:0,他引:1  
王昆仑 《计算机科学》2003,30(7):182-184
1 引言现代维吾尔语(以下简称维语)是维吾尔族人民的主要交际工具,是我国新疆维吾尔自治区的法定工作用语之一,也是新疆其它少数民族共同的交际用语之一。维语属阿尔泰语系,突厥语族。维语语音有元音8个、辅音24个。由辅音和元音构成维语语音音节,每个音节必须且只能有一个元音,单元音可构成音节。维语句子由词构成。句子中有意群重音和句重音。部分音节在语流中产生语流音变现象,常见的有同化、弱化、脱落以及元音和谐等现象。  相似文献   

5.
“调素”论揭示了普通话音节拼接时音长缩短这一韵律现象的本质特征;在基于“调素”论结论的基础上,对时域基音同步叠架(TDPSOLA)算法中的时间标尺修改部分作了相应的调整,使之符合“边缘调素脱落”原理;通过该方法的实施,取得了提高语音合成自然度的效果。  相似文献   

6.
7.
Viavoice语音识别系统是高正确率的语音识别产品。但是 ,有时你得到的识别正确率并没有所期望的那么高。影响语音识别准确性的因素较多 ,本文向你介绍提高识别率的若干心得。一、使用正确的用户在多个用户一起使用Viavoice系统的情况下 ,用不正确的用户进行听写是很容易犯的错误。用错误的用户号听写将导致很差的识别率。因此 ,如果你发现识别率下降时 ,首先检查所使用的用户。二、麦克风或音频输入设备以及声音系统设置要正确这是保证语音识别率的重要因素。如果检查用户无误 ,用适中音调仍不能得到好的语音识别 ,则需要检…  相似文献   

8.
汉语语音识别实用系统研究   总被引:1,自引:0,他引:1  
姚键  古碧绮 《计算机工程》1999,25(4):12-13,52
在分析了传统音识别方法的特点后,提出一种规则结合模型的语音识别思想,并实现了特征空间轨迹匹配+神经网络”方法作为例证。  相似文献   

9.
李祺  马华东  冯硕 《软件学报》2008,19(Z1):96-103
字幕信息有助于观众对音视频内容进行理解,在音视频文件中起着不可或缺的作用.针对自动字幕生成系统的要求,提出了一种灵活、高效的语音端点检测算法,可以在复杂背景噪声的情况下,从连续的音频信号中提取语音端点.将短时能量、短时过零率、短时信息熵这3种基本音频参数进行结合,形成新的音频特征参数:短时能零熵(EZE-feature),在结合了音频信号时域特征和频域特征优点的同时,规避了它们各自的不足.在此基础上,还提出了一种环境自适应的语音端点判定算法,在端点检测过程中对背景噪声进行实时分析,并根据背景噪声的变化对短时能零熵参数进行调整.该语音端点检测算法已被成功应用于自动字幕生成系统中.  相似文献   

10.
本文首先介绍了利用JAVA进行语音技术开发的基础知识,如JAVA的音频引擎,JAVA声音API 1.0,Audioclip接口,数字化音频通道及SPI等技术,最后,介绍了我们在实际项目开发中利用java技术开发声音捕获和播放模块的设计。  相似文献   

11.
基于双向图算法的快速部分汉语语法分析器   总被引:1,自引:0,他引:1  
本文给出了一个用双向图算法实现的快速部分汉语语法分析器。为了实现真实文本的快速部分语法分析,分析器使用FIRST分析表和LAST分析表来更大程度地避免创建不必要的活动弧,并且引进了弧的竞争机制和对于一些情况的处理方法,使用了各种分析策略的分析器的准确率达到87.2%,在主频66MHz的486机型上运行速度是32句/分。  相似文献   

12.
中国古典园林三维造型研究   总被引:1,自引:0,他引:1  
论述了采用层次结构化及参数化三维造型方法,建立一个以造型函数库为核心,从而构造各类、各级园林景观构件表面模型的方法和过程。对于某些非建筑类的园林配景构件,采用了Fractal方法进行造型。  相似文献   

13.
模板匹配技术用于连呼数字识别,其存在的主要问题是巨大的计算量。本文在分析了汉语连呼数字发音参数特征的基础上,提出了一种集预分割和非预分割方法为一体的连呼数字识别算法,该算法的运算量与多级匹配方法,相比有了大幅度下降,本文同时还探讨了语音参数考模板的建立方法对识别性能的影响及通过加入基音信息进一步提高识别性能的途径。  相似文献   

14.
汉语语音合成语料库管理系统的建立   总被引:3,自引:0,他引:3  
本文介绍的语料库管理系统主要用于语音合成的研究或开发工作 .语料的设计考虑了音段和韵律 ,语料库中包括汉语的音节、词语、独白语句和情景对话语篇 ,语音的录制是在卦限录音室完成 .管理系统对各种语音数据进行综合有效的管理 ,它具有查询、浏览和更新等功能  相似文献   

15.
语料设计是汉语语音库工作中的重要环节,本文从音联角度探讨汉语语音库的语料设计,提出用音联(包括闭音联、音节音联、节奏音联)来作为语料中音段声学信息载体,从音位实现角度,提出一种普通话音联分类方案,给出一些统计结果。本文还介绍了一种基于单联选词框架,它能在限定数据量大小的情况下,兼顾声母、韵母、音联以及无调音节等因素统计平衡。  相似文献   

16.
波形编辑语音合成技术及在汉语TTS中的应用   总被引:3,自引:0,他引:3  
本文介绍了近几年迅速发展的基于波形编辑的语音合成技术。文中简介了它的研究内容、基本算法,还介绍了用波形编辑方法实现的汉语文-语转换系统。  相似文献   

17.
基于概念的中文文本可视化表示机制   总被引:1,自引:0,他引:1  
为了浏览因特网上日益增多的在线中文文本,本文给出了基于概念的中文文本可视化表示机制,以直观的方式组织和表示文本及文本集,其基本思想是:首先在概念扩充的基础上,进行文本分类,然后,利用本文提出的提出的文本特征抽取方法和摘要方法,获取广西类别、广西、广西正文的标记的信息,通过类别,文本、有选择地浏览文本。  相似文献   

18.
中文问句分类特征的研究   总被引:1,自引:0,他引:1  
针对"不同的问句分类特征对问句分类的影响不相同,提取和处理这些特征的时间复杂度也不相同"的问题,提取问题疑问词、核心关键词(疑问词的一二级依存词和问句中心语)的主要义原、核心关键词的首义原、问句主谓宾的主要义原、命名实体、名词单(复)数等六种分类特征,采用支持向量机分类算法,对事实疑问句进行不同特征组合的分类对比实验,发现采用词义消岐技术提取的主要义原不仅对分类的准确率影响明显,而且大幅降低特征向量的维数,减少了处理时间。  相似文献   

19.
基于递推最小二乘滤波器的语音增强   总被引:1,自引:0,他引:1  
根据语音信号短时预测特性和短时准周期性,以当前采样前若干点和前若干周期的采样为观测样本,采用横向滤波器结构,构造基于递推最小二乘算法的自适应滤波器。该算法无需先验知识和参考信道,且对平稳或非平稳噪声均适用。实验证明,信噪比有明显提高,且增强后语音信号LPC倒谱与纯净语音LPC倒谱的欧氏距离也比增强前有了明显减小。  相似文献   

20.
基于MQDF的汉语塞音语音识别方法的研究   总被引:1,自引:0,他引:1  
通过对QDF改进方法的探讨,提出了一种基于MQDF的汉语塞音语音识别方法.在该方法中,我们探讨了MQDF的最佳形式并通过实验求出了它的最佳参数,提出了适合于用MQDF进行汉语语音识别的语音特征参数变换方法.通过对汉语塞音语音的识别实验,证明了本文提出的基于MQDF的汉语塞音语音识别方法具有良好的识别效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号