期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	87篇
免费	16篇
国内免费	15篇

专业分类

电工技术	1篇
综合类	19篇
矿业工程	1篇
轻工业	1篇
无线电	23篇
一般工业技术	4篇
自动化技术	69篇

出版年

2023年	1篇
2022年	1篇
2021年	2篇
2019年	4篇
2015年	4篇
2014年	8篇
2013年	16篇
2012年	7篇
2011年	6篇
2010年	2篇
2009年	11篇
2008年	8篇
2007年	7篇
2006年	6篇
2005年	5篇
2004年	2篇
2003年	5篇
2002年	1篇
2000年	5篇
1999年	1篇
1998年	3篇
1997年	2篇
1996年	3篇
1995年	1篇
1994年	2篇
1993年	2篇
1991年	1篇
1990年	1篇
1989年	1篇

排序方式： 共有118条查询结果，搜索用时 0 毫秒

[首页] « 上一页 [3] [4] [5] [6] [7] [8] [9] 10 [11] [12] 下一页 » 末页»

91.

基于上下文三音素DBN模型的连续语音识别

吕国云赵荣椿蒋冬梅 SAHLI H 《计算机工程与应用》2007,43(35):35-38

考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络（SS-DBN-TRI）模型和词间扩展的单流上下文相关三音素DBN（SS-DBN-TRI-CON）模型。SS-DBN-TRI模型是Bilmes提出单流DBN（SS-DBN）模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明：SS-DBN-TRI-CON具备最好的语音识别性能。相似文献

92.

改进的跨语种语音合成模型自适应方法 总被引：1，自引：0，他引：1

刘航凌震华郭武戴礼荣《模式识别与人工智能》2011,24(4):457-463

统计参数语音合成中的跨语种模型自适应主要应用于目标说话人语种与源模型语种不同时,使用目标发音人少量语音数据快速构建具有其音色特征的源模型语种合成系统。本文对传统的基于音素映射和三音素模型的跨语种自适应方法进行改进,一方面通过结合数据挑选的音素映射方法以提高音素映射的可靠性,另一方面引入跨语种的韵律信息映射以弥补原有方法中三音素模型在韵律表征上的不足。在中英文跨语种模型自适应系统上的实验结果表明,改进后系统合成语音的自然度与相似度相对传统方法都有了明显提升。相似文献

93.

基于汉语视频三音素的可视语音合成

赵晖唐朝京《电子与信息学报》2009,31(12):3010-3014

为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出视频三音素的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较高。相似文献

94.

添加音素持续时间信息到频谱模型的说话人辨认研究

刘大鹏尾关和彦朱庆生《微机发展》2007,17(5):156-159

传统的声音识别系统通过短时声音频谱信息来辨识说话人,这种方法在某些条件下具有较好的性能。但是由于有些说话人特征隐藏在较长的语音片段中,通过添加长时信息可能会进一步提高系统的性能。在文中,音素持续时间信息被添加到传统模型上,以提高说话人辨识率。频谱信息是通过短时分析获得的,但音素持续时间的提取却属于长时分析,它需要更多的语音数据。通过大量语音数据探讨了音素持续时间信息对说话人辨识的有效性,提出2种方法来解决数据量小所引起的问题。实验结果表明,当说话人的声音模型被恰当建立时,即使在语音数据量小的情况下,音素持续时间信息对说话人辨识率的提高也是有效的。相似文献

95.

基于HTK的维吾尔语连续音素识别技术研究

米日古力·阿布都热素米吉提·阿不力米提艾克白尔·帕塔尔艾斯卡尔·艾木都拉《计算机工程与应用》2013,(22):150-154,172

以建立维吾尔语连续音素识别基础平台为目标,在HTK（基于隐马尔可夫模型的工具箱）的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。相似文献

96.

基于多流三音素DBN模型的音视频语音识别和音素切分

吕国云蒋冬梅樊养余赵荣椿 H.Sahli W.Verhelst 《电子与信息学报》2009,31(2):297-301

为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象.实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能. 相似文献

97.

Web服务器端藏文字符串长度的近似算法

杨成甫贾彦民吴健《计算机工程与设计》2007,28(5):1173-1175

藏文属于拼音文字,她的书写规则与英语书写规则一样是从左向右,从上到下,但每个单词之间没有空格,只用音节符把每个单词给分隔开.根据藏文文法,藏文的换行只能发生在音节符、单垂符,双垂符与空格的后面.目前主流浏览器(如Firefox,Netscape等)都不能处理藏文的这一断行特性,所以这些浏览器无法正常显示藏文文本,如Firefox将整个一段没有空格文本当作一个单词,造成在屏幕的右边无法换行.结果是用户必须拖动鼠标来浏览整篇文章,给用户带来了很大的麻烦.又由于藏文中大部分的拼音字母的宽度是不同的,在编写HTML文档时候也无法根据藏文字符串的多少来决定字符串的长度.该算法将采用了一个粗略的方法得到一个字符串长度的近似值,再根据行宽的限制在字符串的适当的位置找到一个可断行点进行断行.虽然得到的是近似值,但是基本上解决了主流浏览器无法处理藏文排版的问题. 相似文献

98.

K子空间和时延自相关器的英汉音素识别

罗万伯罗霄岚陈炜彭舰吴端培《电子科技大学学报(自然科学版)》2006,35(1):66-69

提出了用于音素识别的K子空间和时延自相关器神经网络结构,用将时延设计加入线性自相关器,以扩展音素滤波神经网络的方法,产生p维子空间,并采用迭代过程修改划分,以便捕获语音信号中的时间序列信息。这种带不分类训练过程的体系结构提供了一种高识别性能的方法,没有大多数常规语音识别神经网络所常有的网络输出值不表示候选者似然性的缺陷。通过英语音素和汉语音素的初步试验,识别正确率为84.38%,比音素滤波神经网络方法好。相似文献

99.

一种制作录音素材的方法

田汉平《电声技术》2003,(8):66-67

介绍了利用MiCFOSOft Windows中的录音机软件、声卡、传声器及常见家用电器制作wav格式的录音素材的方法。相似文献

100.

音素法语音电路简介

程庆祥《家用电器科技》1990,(1):23-25

相似文献

[首页] « 上一页 [3] [4] [5] [6] [7] [8] [9] 10 [11] [12] 下一页 » 末页»