期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

俞斌贾雅琼《电声技术》2006,(10):24-25,28

提出了基于TMS320VC5402的中文语音合成系统方案。整个系统以TMS320VC5402为核心电路进行设计,采用以音节为单位的中性语调,配合基于基音同步重叠相加的PSOLA算法,并用码激励线性预测编码方法对原始采样音库进行编码压缩。相似文献

2.

基于最小合成单元的维吾尔音库设计 总被引：1，自引：1，他引：0

卡斯木江·卡迪尔古丽娜尔·艾力艾斯卡尔·艾木都拉《通信技术》2012,45(4):83-85

为了实现容量小、可懂度和自然度较好的波形拼接式维吾尔语语音合成系统,结合维吾尔语的特点,完成了文本设计、录音、语音标注、以及音库建设过程。其中,把音节作为基本的合成单元建立了音节语音库;为了弥补音库中不存在音节的合成问题,又建立了音素作为合成单元的音素语音库。实验结果表明,以音节和音素为最小合成单元的波形拼接式维吾尔语语音合成系统除了音库容量相对少等特点之外,还具有良好的可懂度。相似文献

3.

微机打印口在控制TSP5220语音输出中的应用 总被引：1，自引：0，他引：1

徐军侯继红《电子技术》1996,23(9):41-42

文章介绍了一个在微机上利用打印口控制TSP 5220进行语音输出的设计,着重阐述了语音合成板与打印口的硬件接口和相应的软件设计。语音合成板还可应用于其它需要语音输出的场合。相似文献

4.

数据挖掘技术在情感语音合成中的应用

郑鲁王红《信息技术与信息化》2010,(5)

目前,情感语音合成自然度在情感语音合成中成为难点,本论文将数据挖掘技术应用于其中.通过对传统的Aprior算法的改进,探讨了如何提取情感语音韵律参数之间的关系,并且在理论上表明比传统Aprior算法在挖掘情感语音频繁项目集的效率高.应用这些规则,可以很方便的为以后情感语音合成系统的选音提供帮助和参考. 相似文献

5.

科大讯飞让语音合成技术深入社会生活

吴明《通信世界》2006,(6):15

语音技术是现代信息社会及网络经济的关键驱动技术之一.科大讯飞公司在研究面向网络环境及嵌入式环境下的语音合成技术(Text-to-Speech)的基础上,针对复杂的网络环境及有限资源特征的终端设备,实现了高品质的语音合成效果.在国家863计划、国家自然科学基金、国家973计划、电子工业发展基金等支持下,科大讯飞公司在基于语料库的合成技术、鲁棒性文本分析、听感量化的音库裁减技术、中文语音合成标记语言等关键技术上取得了一系列的重要创新和突破,实现了在复杂的网络环境及嵌入式终端设备上,将文本实时合成自然流畅的语音,整体技术达到了国际领先水平. 相似文献

6.

ADPCM处理器DS2165

钱仁和《国外电子元器件》1994,(5)

DS2165是DALLAS公司生产的自适应差分脉冲编码调制ADPCM语音压缩芯片。该芯片可以把64Kbps的语音信号压缩成32Kbps、2 4Kbps或16Kbps的信号。该芯片有两个独立的通道,可用于语音信号的压缩,也可用于语音信号的扩展。本文介绍了它的内部结构、管脚排列、工作原理和实际应用。相似文献

7.

基于PCL的点云数据压缩研究

闫帅邱崧刘锦高《信息通信》2015,(4)

研究基于开源C++编程库PCL(点云库),在VS2010平台上读取由Kinect获取的PLY格式的三维模型数据,利用PCL的Octree(八叉树)类为点云数据构建八叉树结构、进行八叉树编码,实现了点云数据的高效压缩方案。此压缩方案可以针对不同的应用场合设置不同的精简点距离,简洁高效,减少了数据的空间占用,且便于数据的在线传输。相似文献

8.

藏语拉萨语LPC语音参数提取研究

《现代电子技术》2017,(18):20-22

藏语语音参数提取是藏语语音识别的关键技术之一,参数提取的精确度直接影响语音识别的效果。线性预测系数(LPC)是语音信号的重要频域参数,是目前语音信号处理过程中比较重要的处理技术,广泛应用于语音压缩、语音声学建模、语音合成、语音识别等过程中。首先介绍了线性预测算法原理,然后提出了藏语语音LPC参数提取的方案,最后在Matlab平台上实现了藏语语音LPC参数的提取和仿真分析,研究结果对完善藏语语音合成技术和提高藏语语音识别效率有一定的研究参考价值。相似文献

9.

一种无线图像传输系统的方案设计与实现 总被引：1，自引：1，他引：0

程伟左继章许悦雷赖元东《电视技术》2003,(5):18-20

提出了一种无线图像传输系统的设计方案，该方案利用小波图像压缩芯片ADV611完成视频图像的压缩和解压缩。利用传输数据速率为38．4Kbps的数传扩频电台实现了图像压缩数据的无线传输和接收，并给出了实验结果。相似文献

10.

汉语耳语音转换为正常音的研究 总被引：1，自引：0，他引：1

樊星卢晶徐柏龄《电声技术》2005,(12):44-47

耳语音转换为正常音,可应用于公共场所的通信、失语者的语音恢复和司法工作的某些特殊需要等方面。由于耳语发音和正常音在激励源和声道传递函数上存在差异,所以一般的语音合成方法不再适用。分析了耳语音的发音及声学特点,初步建立了一个基于同态信号处理方法并结合相对熵声韵分割的耳语音重建系统,入耳对恢复出的正常音可以正确分辨。相似文献

11.

基于OSYNO 6188的SMS TTS系统的研究与实现

苗新法范春晓《电声技术》2005,(11):64-66

主要叙述了TTS技术原理。提出并实现了一个可靠的文语转换系统——基于语音合成芯片和SMS模块的短消息的语音播报系统。该系统在远程监控中得到了成功应用。相似文献

12.

语音合成系统中语音库样本能量均衡方法研究

下载免费PDF全文

刘伟谢建志《信号处理》2017,33(2):229-235

语音库的质量是决定语音合成(Text to Speech, TTS)效果的重要因素。TTS语音库的制作周期需要六个月左右,期间,发音人的录音状态需要保持一致,即音色、能量皆不能有大的差异,这对于发音人来说是较为困难的。为此,本文给出语音能量均衡方法,其中包括时域包络波动检测算法和帧能量平均算法,旨在解决TTS语音数据库录制后能量不一致现象。首先分析获得标准语音的相关能量参数和波动参数作为模板;其次,利用时域包络波动检测算法对预调节语音样本的合格性进行检验;最后根据帧能量平均准则,对所有合格语音样本进行时域幅值调整,以最大限度地保证语音库整体能量的一致性。实验结果表明,本文提出的语音能量均衡方法可以有效提升TTS语音库质量,具有实际工程意义。相似文献

13.

中文HMM参数化语音合成系统构建 总被引：1，自引：0，他引：1

胡克康世胤郝军《通信技术》2012,45(8):101-103,108

在语音合成领域,大语料库拼接合成方式有一些固有弱点,例如语料库建设成本过高,合成稳定性差等。而基于隐马尔可夫模型(HMM)的语音合成技术在多样化语音合成、多语言支持、系统资源占用方面优势明显。分析了基于HMM的参数化语音合成技术的基本结构和核心算法,研究语料库建设,声学参数提取,建模单元和HMM拓扑结构选择等问题,给出适合于中文语音的参数设置,实现基于HMM的参数化中文语音合成。相似文献

14.

低信噪比下基于FastIca和MMSE-LSA的语音识别

李世绍高勇《电声技术》2014,(1):62-65

针对在低信噪比环境下语音识别率较低的问题,提出了一种基于FastIca和MMSE-LSA相结合的算法。首先,用FastIca对低信噪比语音进行语音提取,再使用MMSE-LSA方法处理得到信噪比改善的语音信号。用0~9十个数字做孤立词语音识别。仿真实验证明,用本算法增强后的语音识别率达到80%以上,可以有效地提高低信噪比环境下语音识别率。相似文献

15.

一种基于语谱图分析的语音增强算法

肖纯智孙大飞高勇《电声技术》2012,36(9):44-48

针对传统谱减法会产生“音乐噪声”及在低噪比环境下降噪效果不理想的问题,提出一种基于语谱图分析的语音增强算法.所提方法先对带噪语音进行谱减处理,再通过语谱图分析对处理后的语音信号进行去小亮块处理,即对“音乐噪声”进行有效的削弱,最后通过设置阈值,滤除低灰度值的成份,即消除残留近似高斯噪声.实验结果表明,提出的算法可以有效地解决谱减法后残留的“音乐噪声”及低信噪比下谱减法残留噪声较大的问题. 相似文献

16.

基于分形维的连续语音实时分割技术

阙大顺李星星胡慧玲《电讯技术》2008,48(11):33-37

为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。相似文献

17.

一种基于低比特率语音算法的芯片设计与分析

张常年夏日升姜岩峰《电讯技术》2007,47(5):42-45

介绍了一种低比特率语音算法,它是在MBE编码算法的基础上,利用线性预测谱代替了MBE中的傅里叶变换谱对MBE编码算法进行了改进,从而在保持语音质量的情况下使比特率更低,达到2 kbit/s.同时阐述了基于该算法的系统芯片设计,并对该算法中的基音周期参数、V/U等参数的提取进行详细的推导分析.最后对本算法与常用的码激励线性预测编码(CELP)的算法进行比较,并分析其中的原因. 相似文献

18.

采用子带长时信号变化特征的稳健语音活动检测

蔡铁唐飞龙志军《电视技术》2014,38(19)

为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率. 相似文献

19.

基于概率耦合的双直接判决先验信噪比估计算法

下载免费PDF全文

欧世峰赵艳磊宋鹏高颖《电子学报》2020,48(8):1605-1614

直接判决（DD,Decision-Directed）算法结构简单、音乐噪声抑制能力较好,是当前语音增强领域最为常用的先验信噪比估计方法.但该算法对于滑动因子的选取数值较为敏感,且估计性能要受到时延问题的限定.本文首先采用实际的语音和噪声数据,根据音乐噪声残留及输出语音失真两方面的评测标准对DD算法中滑动因子的取值问题进行了研究,通过数据分析给出了其较为明确的上下边界值;然后基于语音及噪声信号的复高斯分布模型,采用软判决技术对两个具有不同滑动因子的DD算法进行概率耦合,提出了一种具有双DD结构的先验信噪比估计算法.该算法可以充分结合两个具有不同特性DD算法的优点,在音乐噪声抑制及限制语音失真等方面均获得了较为理想的输出效果.多种噪声背景及输入信噪比条件下的仿真结果表明,相对于目前流行的几种先验信噪比估计算法,本文提出算法具有更为优良的估计性能. 相似文献

20.

ATM网络中语音编码和传输的新方案 总被引：2，自引：0，他引：2

杨震毕厚杰《通信学报》2000,21(5):23-29

本文针对未来新的ＡＴＭ通信方式,提出了一种新的语音可变速率编码和可变时延传输系统方案,为了将信号源和人耳听觉的特征,与ＡＴＭ网络的统计复用性相结合,实现语音的码率在缩和低时延传输,该方案将ＡＴＭ网络环境和语音编码系统中最优信号分析区间的选取、编码系统参数的确定相结合。文中基于一种新的分布熵进行信号特征判断,对输入信号构成不同的处理系统,具体编码由小波变换分带、多带二进树ＶＱ构成,输出码率可调,改变相似文献