首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
一种新颖的基频包络聚类方法   总被引:1,自引:0,他引:1  
主要研究音节基频包络的聚类问题.在聚类的基础上,通过合理的样本选择,可以实现对大语料库的裁减,再结合现有的语音编码技术,就能够构建出一个小存储容量多样本的带调音节语音库,来满足嵌入式TTS系统对合成语音清晰度和自然度的要求.针对音节基频包络长度的不同,给出了一种非定长包络的聚类方法,这种方法将DP(dynamic programming)的概念融入了聚类.首先利用DP的思想,在两个基频包络之间寻找一条最佳路径,然后再沿这一路径进行两包络的相似度计算,若两包络形状类似,距离测度的值会很小.实验表明,与传统的方法相比,使用新方法可以获得更好的聚类结果.合成实验也验证了这种方法的有效性.  相似文献   

2.
针对模糊文本聚类算法(FCM)对输入顺序以及初始点敏感的问题,提出了一种使用蚁群优化的模糊聚类算法(FACA)。该算法采用蚁群聚类算法(ACA)找到聚类的初始中心点,以解决模糊聚类的输入顺序以及初始点敏感等问题。模糊文本聚类算法的线性复杂度使其更便于在计算机实现。与经典的基本模糊聚类以及蚁群聚类在真实数据集上仿真相比较,结果表明经蚁群优化过的模糊聚类算法(FACA)效果更有效,更适合应用于大型的数据集。  相似文献   

3.
引言文语转换系统具有将输人的文字自动地转换成语音的功能,广泛地应用于文稿校对、语音应答系统、电子邮件的语音服务等领域。根据合成模型的不同,可以将文语转换技术划分为三类川,即基于声学模型、发声模型和对自然语音进行编码模型的文语转换技术。基于声学模型的文语转换技术以语音产生的源一滤波器理论为基础,最典型的是共振峰合成方法;基于发声模型的文语转换技术是通过模拟人的发声过程来合成语音;对自然语音进行编码主要由对波形进行压缩存储和解码回放组成  相似文献   

4.
介绍了面向中英文双语应用的英文语音合成系统中基于混合基元模型的非定长基元选取算法.清华大学计算机系人机语音交互实验室针对中英文混读相同发音人的限定,实现了基于混合基元模型的语料库构建和鲁棒灵活的非定长基元选取方法,在一定程度上弥补了发音人英语发音不饱满、自由度大的缺陷,真正实现了相同发音人中英文混读的要求.试验证明,采用这些方法能够极大的提高合成质量,达到令人满意的效果.  相似文献   

5.
基于EM算法的文本聚类优化研究   总被引:1,自引:0,他引:1  
针对现有的文本聚类算法难以取得满意结果的问题,以EM算法为基础,提出能分别描述相似、不相似聚类对的相似性分布以及重要、不重要文档的重要性分布的文本聚类优化模型(text clustering optimization model, TCOM).基于该模型,设计一种通过合并不同的文本聚类结果以获取最优性能的方法.实验结果表明,利用该方法同时改善了聚类精度和召回率,其性能优于单独使用现有的硬、软聚类算法.  相似文献   

6.
音节点是藏文文本的重要组成部分。本文首次将数学形态学膨胀算法和K均值聚类算法用于藏文音节点检测,提取真实音节点。经测试表明这种方法具有检准率和检全率高、速度快的特点。  相似文献   

7.
通过分析影像数据的特点,利用直方图的统计特性,结合HCM收敛速度快的优点,提出了一种基于直方图加权的半模糊化的聚类算法,此方法结合了全局与局部信息,提高了聚类的速度,改善了聚类的效果;采用Lena和脑影像实验与传统算法作比较证明了该算法的效果更好,并对一副97 658k的影像进行处理,证明了该算法效率高。  相似文献   

8.
提出上下文音节为拼接单元,生成自然语音的一种维吾尔语语音合成方法。上下文音节有效地整合了邻近音节内外的音联现象,可以避免大部分协同发音影响。采用基于时域平滑技术对合成语音进行平滑处理,减少在拼接点处的语音失真和突变,从而提高了合成语音的自然度。  相似文献   

9.
基于CURE的用户聚类算法研究   总被引:1,自引:0,他引:1  
通过对Web网站的日志进行聚类分析,目的是获取用户兴趣访问模式,进而为不同用户群体提供定制的个性化服务。针对原始CURE算法在代表点选择的随机性、不能充分体现用户兴趣偏好方面存在的问题,提出了改进的用户聚类算法,根据用户兴趣的显著特征提取元素的主要属性进行预聚类,为小类合并提供合理的初始类集,实验结果证明了该方法有较好的聚类结果。  相似文献   

10.
文本聚类是信息检索的重要内容。为了避免使用计算过程复杂的聚类算法,并能从语言学角度对聚类特征和聚类结果进行分析和解释,该文提出了采用句法分布信息进行文本聚类的方法。在汉语依存树库中,得出10种具有显著差异的词类依存关系,以其中5种依存关系作为聚类特征,访谈会话类和新闻播报类文本的相似度分别为71.98%和83.13%。实验结果验证了该方法利用依存关系对文本聚类的可行性和有效性。  相似文献   

11.
本文是对于藏语天气预报的语音合成系统的简单研究,针对藏文的特殊性设计相应的语料库以及韵律参数库、合成参数库,提供基音同步叠加算法(PLOSA)需要的修改因子,通过修改时长、基频等参数最终实现语音的合成。  相似文献   

12.
童强 《现代计算机》2003,(12):90-92
TTS技术已经越来越广泛地应用到现代计算机的各个领域,本文介绍了利用微软的Microsoft Speech SDK5.1提供的TTS(text-to-speech)技术开发具有语音朗读功能的应用程序。  相似文献   

13.
基于传统Chan-Vese( CV)模型,结合图像聚类信息,提出一种有效的活动轮廓模型图像分割方法。该方法首先改进CV模型的能量泛函,考虑图像的梯度信息,提高图像分割的精确度。其次在能量泛函中添加图像的聚类信息系数K,并使用图像的聚类信息实现对水平集轮廓曲线的自动初始化。在分割处理彩色图像时,为提高分割效率,对彩色RGB图像的三通道进行加权处理。最后为能量泛函添加正则项,避免水平集的重新初始化,完成对灰度图像及彩色图像的快速精确分割。实验表明该方法的有效性。  相似文献   

14.
音节是泰语构词和读音的基本单位,泰语音节切分对泰语词法分析、语音合成、语音识别研究具有重要意义。结合泰语音节构成特点,提出基于条件随机场(Conditional Random Fields)的泰语音节切分方法。该方法结合泰语字母类别和字母位置定义特征,采用条件随机场对泰语句子中的字母进行序列标注,实现泰语音节切分。在InterBEST 2009泰语语料的基础上,标注了泰语音节切分语料。针对该语料的实验表明,该方法能有效利用字母类别和字母位置信息实现泰语音节切分,其准确率、召回率和F值分别达到了99.115%、99.284%和99.199%。  相似文献   

15.
为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果.  相似文献   

16.
首先简要介绍语音合成技术的总体概念及研究状况,然后提出用不同长度的单元进行拼接的维吾尔语语音合成方法。该方法能更好地利用自然语流的原始信息.提高合成语音的自然度,同时也能提高系统的灵活性。  相似文献   

17.
为改善决策树聚类的效果,避免可能出现的聚类模型过训练或欠训练的情况,提出一种基于最小生成误差以及通过交叉验证优化最小描述距离(MDL)因子选取的方法。文中通过计算交叉验证中的生成误差选择MDL因子,从而优化决策树大小。实验结果表明,此方法相对传统的固定MDL门限设定方法,更有效提升合成语音的音质和自然度。  相似文献   

18.
本文阐述了一个自动播音系统的设计与实现过程。该系统基于微软Speech API(简称SAPI)接口设计,能够根据动态检索的信息实时播音;自动加入XML标记使播音精确化;播音与音乐合成,通过自动音量控制,产生具有背景音乐的播音效果。实践证明,基于SAPI接口开发自动播音系统是现实可行的。它能够满足一般情况下播音的需要。自投入使用以来,该系统运行稳定可靠,效果良好。  相似文献   

19.
根据语音合成与识别等语音应用研究的需求,从实验语音学的角度出发,研究维吾尔语固有音节结构中最常见的CVC音节类型的声学特征,从“维吾尔语语音声学参数库”中选择1 255个CVC型音节的各种韵律参数,包括音节时长、音强和音高,进行统计分析并归纳其时长、音高和音强分布模式。  相似文献   

20.
在模糊k平面聚类(KPC)算法的基础上,通过引入正交约束提出正交模糊k平面聚类算法(OFKPC)。与KPC及模糊KPC(FKPC)类似,OFKPC仍从原型出发,用k组超平面替代传统的点(类中心)作为聚类原型。同时根据KPC及FKPC的思想,中心超平面是用来尽量区分不同类样本,因此这些超平面法向量构成的矩阵可用来进行特征降维。在人工数据集和UCI数据集上实验表明,OFKPC算法不仅较FKPC算法有更好的聚类效果,且具有更强的特征降维能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号