期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	88篇
免费	15篇
国内免费	16篇

专业分类

电工技术	1篇
综合类	19篇
矿业工程	1篇
轻工业	1篇
无线电	23篇
一般工业技术	4篇
自动化技术	70篇

出版年

2023年	1篇
2022年	1篇
2021年	2篇
2019年	4篇
2015年	4篇
2014年	8篇
2013年	16篇
2012年	7篇
2011年	6篇
2010年	2篇
2009年	11篇
2008年	8篇
2007年	8篇
2006年	6篇
2005年	5篇
2004年	2篇
2003年	5篇
2002年	1篇
2000年	5篇
1999年	1篇
1998年	3篇
1997年	2篇
1996年	3篇
1995年	1篇
1994年	2篇
1993年	2篇
1991年	1篇
1990年	1篇
1989年	1篇

排序方式： 共有119条查询结果，搜索用时 31 毫秒

[首页] « 上一页 [1] 2 [3] [4] [5] [6] [7] [8] [9] [10] [11] 下一页 » 末页»

11.

TTS语音单元边界的自动切分 总被引：2，自引：0，他引：2

王丽娟曹志刚《微电子学与计算机》2005,22(12):8-11

语音单元边界的准确切分对基于波形拼接的语音合成系统至关重要。文章采用了两步切分方法，第一步中先由基于HMM模型的强制对齐方法得到初始的边界．在第二步中提出用基于前后音素的边界模型来修正初始边界。为解决训练数据不足的问题，提出用分类与衰退树将前后因素发音相近的边界模型进行聚类。这样可以根据训练数据的多少，动态调节边界模型的数目，以保证模型训练的可靠性。在对中文语音库的实验中，自动切分的准确度由78．7％提高到91．5％。相似文献

12.

基于音素混淆网络的蒙古语语音关键词检测方法的研究

飞龙高光来鲍玉来《中文信息学报》2015,29(1):178-182

蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混淆矩阵改进了关键词的置信度计算方法。实验结果表明,基于音素混淆网络的蒙古语语音关键词检测方法可以较好地解决集外词的检测问题。蒙古语语音关键词检测系统采用改进的置信度计算方法后精确率提高了6%,召回率提高了2.69%,性能得到明显的提升。相似文献

13.

基于电话语料的维吾尔连续音素识别

米日古力·阿布都热素艾克白尔·帕塔尔艾斯卡尔·艾木都拉《通信技术》2012,45(7):54-56

结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。相似文献

14.

基于音素评分模型的发音标准度评测研究 总被引：1，自引：1，他引：0

严可戴礼荣《中文信息学报》2011,25(5):101-109

在计算机辅助语言学习系统中,后验概率是普通话水平测试(PSC)电子化系统衡量考生发音标准程度的重要指标,但后验概率与人工的主观评分存在着显著差别。该文提出了“音素评分模型”的思想,对后验概率进行变换。该文研究了线性和非线性的sigmoid音素评分模型,并发现线性音素评分模型有闭式全局最优解,非线性音素评分模型可用梯度下降法求解。在全国采集的498人的普通话考试现场数据集上的实验表明该策略能使系统评分性能有明显的提升当后验概率在全音素概率空间中计算时,可使系统性能提升约42%;当后验概率在优化的概率空间中计算时,能使系统性能提升约23%～27%。相似文献

15.

基于音素聚类的多语言声学建模方法

孟猛梁家恩徐波《模式识别与人工智能》2009,22(1)

首先提出以音素合并后模型自身似然度下降为距离依据,通过聚类生成多语言通用音素的声学建模方法.在此基础上,比较聚类时增加两种约束条件(同一语种内音素不聚类、不同IPA族的音素不聚类)对性能的影响.同时,对通用音素集的规模对识别性能的影响做了一定探索.最后的实验给出建立中英文双语混合模型在关键词检测系统上的结果,比较4种聚类方法在不同通用音素个数情况下的性能优劣.结果显示,使用本文方法进行一定程度的音素合并,性能比不作聚类直接混合建模有明显提升.适当增加音素聚类的约束,有助于进一步提高性能. 相似文献

16.

基于n元语法模型的领域语音指令识别

吴应中朱华勇李杰《微计算机信息》2009,25(14)

本文采用一种音素匹配法结合改进了的n元语法模型的方法,时语音指令进行理解.指令按照结构划分类别,通过提取其中关键要素来获取指令语义.音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采用改进的n元语法模型进行推测.实验表明该方法取得了较好的效果,并在原有的基础上有一定的提高. 相似文献

17.

基于模型混淆度的模型组合算法研究

吴娅辉刘刚郭军《自动化学报》2009,35(5):551-555

传统的声学模型训练算法如最大似然估计(Maximum likelihood estimation, MLE), 在训练时只考虑了模型自身而没有考虑模型之间的相互影响. 为了进一步提升模型的识别效果, 区分性训练算法被提出. 本文在最小音素错误(Minimum phone error, MPE)区分性训练算法的基础上提出一种基于模型间混淆程度进行模型组合的算法: 针对单混合分量模型, 依据模型间混淆程度对MLE和MPE的模型进行加权组合; 针对多混合分量模型, 提出一种模型选择的算法来获取新的模型参数. 实验表明, 与MPE算法相比, 对单分量的情况, 该算法可以使系统的误识率相对降低4%左右; 对于多分量的情况, 该算法可以使系统的误识率相对降低3%左右. 相似文献

18.

基于汉语文本驱动的人脸语音同步动画系统

下载免费PDF全文

杜鹏房宁赵群飞《计算机工程》2012,38(13):260-262,265

为解决动画流与语音流的同步问题,设计并实现一种人脸语音同步动画系统。将所有中文音素分为16组中文可视音素,并用输入的人脸图像合成对应的关键帧,分析输入文本得到中文可视音素序列和动画的关键帧序列,将该关键帧序列与语音流对齐,在关键帧之间插入过渡帧的同时,播放语音流和动画流,以实现人脸语音同步动画。实验结果表明,该系统能产生符合人们视觉和听觉感受的人脸语音同步动画。相似文献

19.

基于长时性特征的音位属性检测方法

下载免费PDF全文

许友亮张连海屈丹牛铜《计算机工程》2012,38(11):160-162,166

提出一种基于长时性信息的音位属性检测方法,该方法通过高、低两层时间延迟神经网络(TDNN)进行实现,低层TDNN在短时特征上进行音位属性的检测,高层TDNN在低层检测结果的基础上,对更长时段上的信息进行融合。实验结果表明,引入长时性特征使得音位属性检测率提升约3%,将音位属性后验概率作为音素识别系统的观测特征,使用长时性特征的识别结果提升约1.7%。相似文献

20.

基于预训练与音素字节对编码的越南语识别

沈之杰郭武《数据采集与处理》2023,38(1):101-110

基于无监督预训练技术的wav2vec 2.0在许多低资源语种上获得了良好的性能,成为研究的热点。本文在预训练模型的基础上进行越南语连续语音识别。将语音学信息引入到基于链接时序分类代价函数（Connectionist temporal classification,CTC）的声学建模中,选取音素与含位置信息的音素作为基础单元。为了平衡建模单元数目以及模型的精细程度,采用字节对编码（Byte-pair encoding,BPE）算法生成音素子词,将上下文信息结合到声学建模过程。实验在美国NIST的BABEL任务低资源的越南语开发集上进行,所提算法相对wav2vec 2.0基线系统有明显改进,识别词错误率由37.3%降低到29.4%。相似文献

[首页] « 上一页 [1] 2 [3] [4] [5] [6] [7] [8] [9] [10] [11] 下一页 » 末页»