首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 620 毫秒
1.
介绍了面向中英文双语应用的英文语音合成系统中基于混合基元模型的非定长基元选取算法.清华大学计算机系人机语音交互实验室针对中英文混读相同发音人的限定,实现了基于混合基元模型的语料库构建和鲁棒灵活的非定长基元选取方法,在一定程度上弥补了发音人英语发音不饱满、自由度大的缺陷,真正实现了相同发音人中英文混读的要求.试验证明,采用这些方法能够极大的提高合成质量,达到令人满意的效果.  相似文献   

2.
孙钦东  黄新波  王倩 《软件学报》2008,19(3):674-686
分析了中英文混合环境下多模式匹配的特点,以及已有多模式匹配算法应用于中英文混合环境时的不足,给出并证明了中英文混合环境下多模式匹配算法的性能定理,提出了一种适合于中英文混合环境的基于线索完全哈希Trie结构的多模式匹配算法.该算法扩展了标准Trie结构,以中英文字符内码为键值构造完全哈希Trie匹配机,并利用模式串之间的关系对Trie匹配机进行线索化.理论分析与实验结果表明,所提出的算法在匹配中无需复杂的哈希运算,不需要回溯匹配指针,在中英文混合环境下能够进行正确、高效的匹配,而且不存在空间膨胀问题,具有较低的空间与时间复杂度,有较大理论与应用价值.  相似文献   

3.
为了提高资源匮乏语言的情感分类性能,提出一种基于对抗双向GRU网络相结合的跨语言情感分类模型(ABi-GRU)。通过基于语义双语词嵌入方法来提取中英文文本词向量特征;结合注意力机制的双向GRU网络提取文本的上下文情感特征,同时引入生成对抗网络缩小中英文向量特征分布之间的差距;通过情感分类器进行情感分类。实验结果分析表明,该方法有效地提升了跨语言情感分类的准确率。  相似文献   

4.
基于标准美音声学模型对英语朗读发音进行评测,准确性相对较低,因此本文设计了英语朗读发音质量自适应评测模型,并以实验分析测试了自适应评测模型.结果表明,系统可准确测评朗读发音质量,从而切实反应朗读者英语口语水平;模型在评测朗读者英语发音时适应性与标准性较高,基于发音准确性、流利性、完整性,可全面衡量朗读发音质量;智能校对系统基于灭错计算进行发音识别评测与校对,可提升语音识别能力,提高评测准确性,以根本上避免评测混乱;利用支持向量回实现特征融合,接近评分特征与人工评分的非线性关系,可保障发音质量评测准确性与可靠性.  相似文献   

5.
王祖辉  姜维 《计算机工程》2009,35(13):188-189,207
针对中英文混合垃圾邮件过滤问题,提出一种基于支持向量机(SVM)的过滤方法和融合多种分类特征的框架.通过改进SVM中线性核的表示方式,解决存储空间和计算最问题.通过领域术语自动抽取技术,增强垃圾邮件过滤的语义单元识别能力,提高垃圾邮件分类性能.在跨语言大规模语料库上的实验表明,采用SVM比采用Good-Turing算法平滑的朴素贝叶斯模型泛化性能提高了6.13%,分类精度比最大熵模型提高了8.18%.  相似文献   

6.
提出一种使用韵律模型的方法来改进计算机辅助语言学习中的发音质量评价性能.该方法在原有的单音子和三音子模型的基础上,添加了韵律因素.一方面,这使得对影响发音质量最大的元音音素的描述更为细致;另一方面,包含韵律模型的方法从一定程度上解决了使用母语训练库和非母语测试库之间的模型不匹配问题,为语言学习机在母语和非母语之间的交叉应用提供了可能.同时,这种改进的方法还为计算机辅助语言学习系统中的错误检测和反馈提供了很好的参考,更进一步增加了发音质量评价模块在整个学习机系统中的指导作用.试验中,使用WSJ(母语库)作为训练库,ESC(非母语库)作为测试库,基于带韵律的Mono-Phone模型得到的匹配分数,段长分数,感知分数融合结果与主观评价之间的最终相关性为0 839,比原有基本英语音素的方法的融合结果提高了0 08(0 753).  相似文献   

7.
针对汉语的发音习惯以及语音可视化技术中对口型动画自然、连续的要求,提出了一种基于肌肉模型与协同发音模型的与语音保持同步的口型动画的方法.首先,根据汉语发音时的口型视位特征将声、韵母音素归类,并用数据映射的方式合成与之对应的口型关键帧.通过分析输入的文本信息,合成与语音保持同步的三维人脸口型动画.为了解决汉语发音习惯的问题,设计了一种基于微分几何学描述的协同发音建模的方法,该方法通过分析相邻音子间视素的影响权重,可以产生符合汉语发音习惯的口型动画.最后,通过实验对比和分析,该方法产生的口型动画更为逼真,且符合汉语发音的习惯.  相似文献   

8.
改进的跨语种语音合成模型自适应方法   总被引:1,自引:0,他引:1  
统计参数语音合成中的跨语种模型自适应主要应用于目标说话人语种与源模型语种不同时,使用目标发音人少量语音数据快速构建具有其音色特征的源模型语种合成系统。本文对传统的基于音素映射和三音素模型的跨语种自适应方法进行改进,一方面通过结合数据挑选的音素映射方法以提高音素映射的可靠性,另一方面引入跨语种的韵律信息映射以弥补原有方法中三音素模型在韵律表征上的不足。在中英文跨语种模型自适应系统上的实验结果表明,改进后系统合成语音的自然度与相似度相对传统方法都有了明显提升。  相似文献   

9.
黄双  李婧  王洪莹  杨军  张波 《计算机应用》2006,26(Z2):287-289
提出了一种新的评价英语发音质量的算法.该算法采用基于隐马尔科夫模型(HMM)的语音识别技术,引入各音素对应的发音易混淆模型(Pronunciation Confusion Model),定义段时长归一化的相似度比例对数为各音素的发音质量分数,并综合得到整句发音的评分结果.该算法降低了不同发音人对评分准确性的影响,提高了系统的稳健性.实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,明显优于其他评分算法.  相似文献   

10.
通过介绍几种持续出席模式的视频合成方法,以及分析H.264不能采用快速编码域合成方法的原因,深入研究了一种像素域和编码域相结合的混合合成方法,利用H.264标准的新特性,对解码图像帧的选择、合成图像帧的条带组分割、宏块编码参数的设置以及I集合的构造等问题进行了分析和改进,实验结果表明改进方法在降低计算复杂度和码率的同时视频质量约提高0.4-0.7dB.  相似文献   

11.
由于历史原因,哈萨克语(下面简称哈语)在不同的地区形成了不同的文字形式,哈萨克斯坦哈萨克人用斯拉夫字母为基础的斯拉夫字母哈萨克文,而中国哈萨克人用的是阿拉伯字母为基础的阿拉伯字母哈萨克文。为了方便两国之间经济文化的交流,开发自动转换系统具有重要意义。C#编写的哈萨克语两种文字间相互智能转换程序,采用基于规则的方法实现了哈萨克语两种文字形式间的智能转换,准确率达到95.5%。  相似文献   

12.
In this paper we study a subclass of pebble automata (PA) for data languages for which the emptiness problem is decidable. Namely, we show that the emptiness problem for weak 2-pebble automata is decidable, while the same problem for weak 3-pebble automata is undecidable. We also introduce the so-called top view weak PA. Roughly speaking, top view weak PA are weak PA where the equality test is performed only between the data values seen by the two most recently placed pebbles. The emptiness problem for this model is still decidable. It is also robust: alternating, non-deterministic and deterministic top view weak PA have the same recognition power; and are strong enough to accept all data languages expressible in Linear Temporal Logic with the future-time operators, augmented with one register freeze quantifier.  相似文献   

13.
一种带密钥的阈下信道通信算法   总被引:3,自引:0,他引:3  
李顺东  覃征 《计算机学报》2003,26(1):125-128
提出了一种新的建立带密钥阈下信道的方法,利用此方法建立的属下信道,计算量小,带宽比较宽。主要结果有两个方面:证明了不同字母表上的语言具有相同的信息表达能力,利用这个事实,通过不同的字母表上的语言信息变换隐藏建立一种带密钥的阈下信道通信模型。通过该模型的实例化,可以建立实用的阈下信道。模型实例化的过程就是确定具体密钥的过程,为建立实用的阈个信道提供了严格的理论与实用技术。在隐藏通信中具有一定的应用前景。  相似文献   

14.
徐占  董洪伟 《计算机工程》2010,36(14):233-234
从蛋白质结构特性出发,利用结构字母表和CGR游走技术将蛋白质三维结构信息转换到二维坐标空间中。通过分析所得图像找出蛋白质分子的主体结构,获得各结构点在CGR图中的坐标,利用Hausdorff距离判定要比较的蛋白质对象相似性。该方法实现了蛋白质相似性比较的结构-序列模式转变,利用Hausdorff距离比较两点集间相似性的优势,为蛋白质相似性比较提供了一种简便有效的方法。  相似文献   

15.
We show that if a language over a two-letter alphabet belongs to P, then its unary encoding belongs to 2DPDA(1).  相似文献   

16.
对图像文字进行细化有助于突出文字的形状特点和减少冗余的信息量,在文字识别 领域有着重要的应用。在分析研究传统细化算法后,针对传统细化出现的畸变、细化不完全现象, 提出了一种对国际音标图像字符的细化方法。该算法通过对文字区域的边缘分类标记,并判断被 标记点是否满足可去除条件,然后逐步去除边缘像素点,最终能让国际音标图像字符的宽度细化 到一个像素宽度。针对国际音标图像字符的实验表明,该算法能够准确地对国际音标图像字符进 行细化,且简单高效。  相似文献   

17.
The equivalence problem is considered for regular expressions over a partially commutative alphabet. The alphabet is decomposed into disjoint subsets of noncommutative elements. The special case of the problem when the cardinal number of only one subset is larger than 1 and the cardinal numbers of the other subsets are equal to 1 is proved to be algorithmically solvable. Translated from Kibernetika i Sistemnyi Analiz, No. 3, pp. 65–74, May–June 2009.  相似文献   

18.
Hung‐Yan Gu 《Software》2005,35(11):1027-1039
In this paper, a large‐alphabet‐oriented scheme is proposed for both Chinese and English text compression. Our scheme parses Chinese text with the alphabet defined by Big‐5 code, and parses English text with some rules designed here. Thus, the alphabet used for English is not a word alphabet. After a token is parsed out from the input text, zero‐, first‐, and second‐order Markov models are used to estimate the occurrence probabilities of this token. Then, the probabilities estimated are blended and accumulated in order to perform arithmetic coding. To implement arithmetic coding under a large alphabet and probability‐blending condition, a way to partition count‐value range is studied. Our scheme has been programmed and can be executed as a software package. Then, typical Chinese and English text files are compressed to study the influences of alphabet size and prediction order. On average, our compression scheme can reduce a text file's size to 33.9% for Chinese and to 23.3% for English text. These rates are comparable with or better than those obtained by popular data compression packages. Copyright © 2005 John Wiley & Sons, Ltd.  相似文献   

19.
20.
Mechanisms different from the well-known DOL-systems are proposed for construction of cube-free words. A generator is presented, which is described by logical programming means and models the process of derivation in arbitrary grammars. Translated from Kibernetika i Sistemnyi Analiz, No. 6, pp. 18–25, November–December, 1999.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号