首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
通过特征匹配的方法进行无人机影像拼接,不需要地面控制点坐标和内外方位元素.基于SIFT算法进行特征匹配,对于匹配中容易出现的误匹配点,通过合理控制算法中的阈值大小并采用唯一性约束和视差约束来进行剔除,采用分块控制匹配点数目来剔除密集匹配点对,使匹配点对分布均匀.使用RANSAC算法来计算影像之间的转换模型,实验证明这种方法具有很好的拼接效果.  相似文献   

2.
在对现有图像拼接方法进行研究的基础上,提出一种基于特征点匹配的图像拼接方法。采用对图像质量与光照等因素具有较强鲁棒性以及丰富匹配信息的尺度不变特征变换匹配算法对特征点进行提取和匹配,使用随机抽样一致性去粗算法求得两幅图像间的H矩阵初值,并运用迭代精炼算法求出H矩阵的精确值,利用摄像头预先拍摄好的固定角度的图像来得到转换角度的H矩阵,从而将均具有角度差的两幅图像调整至垂直拍摄的平面,最后根据尺度不变特征变换匹配算法及投影算法将调整后的两幅图像拼接。实验表明,本方法简单易行,可降低具有角度差的两幅图像拼接后的边缘变形,从而改善拼接质量。  相似文献   

3.
在语音合成系统中,韵律特征参数的描述正确与否直接影响着语音合成系统的输出效果。为了解决目前语音合成技术中提高合成语音自然度这一难点,研究了数据挖掘技术来发现韵律参数之间的相互关系。通过改进Apriori算法对这些关系进行规则描述,来解决目前语音合成中缺陷的前后音节的韵律参数之间的关系。结果表明,经改进后适合语音数据的Apriori算法,可以获得汉语韵律参数中基频参数和时长参数的变化规则,这些规则较方便的为语音合成系统的选音提供帮助和指导。  相似文献   

4.
在语音合成系统中,韵律特征参数的描述正确与否直接影响着语音合成系统的输出效果。为了 解决目前语音合成技术中提高合成语音自然度这一难点,研究了数据挖掘技术来发现韵律参数之间的 相互关系。通过改进Apriori算法对这些关系进行规则描述,来解决目前语音合成中缺陷的前后音节的 韵律参数之间的关系。结果表明,经改进后适合语音数据的Apriori算法,可以获得汉语韵律参数中基频 参数和时长参数的变化规则,这些规则较方便的为语音合成系统的选音提供帮助和指导。  相似文献   

5.
汉语语音合成中文本处理的几个问题   总被引:3,自引:0,他引:3  
分析了汉语语音合成系统中文本处理的特点,提出了利用多知识源进行文本处理的思想,有效地结合了分析处理过程中的静态知识和动态知识,针对不同的对象采用不同的知识源处理,兼顾了不同知识源的一致性和相关性,为语言学处理模块的设计与实现提供了的层次化结构。  相似文献   

6.
在已研制的MPLPC规则合成系统的分析与改进的基础上,提出了采用保留语音相邻音素间过渡段信息为合成单元,对稳态音素进行帧压缩,用MPLPC和音调调制,按规则合成较高质量的汉语单音节语音方法。  相似文献   

7.
针对TD-PSOLA韵律调整能力的不足,将基于基音同步的时频域插值(TFI)方法应用于汉语语音合成中,该方法能够保证基频调整和时长的调整不会相互影响.为了提高计算精度,在频谱的插值计算中还引入了差商型插值方法.实验结果表明,采用差商型插值的TFI方法能取得比较好的合成效果.  相似文献   

8.
利用语音合成芯片 TC8830 AF的 CPU控制方式下的 DMA功能 ,主控微机可共享语音数据存储器 SRAM资源 ,对语音数据直接操作 ,实现语音数据的快速处理 ,对语音合成库的建设机理进行了深入探讨 ,并提出了一种实用的汉语数码语音识别方法 .实践结果表明本系统适用于语音合成产品的开发  相似文献   

9.
研究了全景图生成过程中相关图片拼接的问题.探讨了通常的2种图像拼接算法及其优缺点,在定义匹配图、包含图和模板图的基础上,提出了一个基于模板匹配的全景图拼接算法,引入标准相似度实现模板匹配,在Visual C++6.0环境中编程实现图片的拼接,并验证了算法的正确性.  相似文献   

10.
为了实现多视三维数据的自动拼接,提出了一种数据拼接方法。利用标志点的空间特征不变性,通过引入距离矩阵和匹配信息表,根据匹配标志点之间的约束关系,实现了标志点的匹配,同时利用相邻区域测量数据之间的关系,基本消除了匹配歧义问题。运用奇异值分解法求解旋转矩阵R和平移向量T,实现测量数据拼接。多视拼接实例表明,本算法具有较强的鲁棒性,能够实现对多视数据的快速,自动拼接,具有很好的实用价值。  相似文献   

11.
基于时频分步处理的PSOLA韵律合成方法   总被引:2,自引:0,他引:2  
结合FD PSOLA和TD PSOLA算法的优势 ,提出一种音高、时长分步处理的语音韵律拼接合成方法 .根据韵律生成模型计算得到的基频参数和时长参数 ,分别在频域和时域对语音拼接单元进行调整 ,在保持音库语音拼接单元清晰度和自然度基本不变的情况下 ,合成语音的韵律调控能力得到提高 .以汉语短语词组合成实验证明了该方法实现的有效性 .  相似文献   

12.
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值.  相似文献   

13.
浊声基频轮廓对汉语合成自然度提高的分析与综合   总被引:1,自引:0,他引:1  
连续语音浊声基频轮廓是影响合成语音自然度和表现力的一个重要因素 .本文采用序位调值分类统计法 ,对汉语连续语音音调动态特性作了系统分析 ,提出一种用于分析和分层产生汉语连续语音基频参数的数学模型 .模型充分考虑了汉语发音特点 ,归纳了语言表达中音调变化的各种可能 ,并相应设置了控制调整参量 ,相对完整而实用地表示了语言知识和基频参数之间的对应关系 .对一些典型自然语句进行了仿真实验 ,结果表明 ,该模型控制产生的合成基频轮廓和测试目标可达到满意的吻合 ,对有效改善TTS系统语音合成自然度作用明显 .  相似文献   

14.
基于小波变换的静音与语音分割新算法   总被引:6,自引:1,他引:6  
含噪语音信号的静音与语音分割,即端点检测问题是语音识别至关重要 的一步,为了提高语音分割对环境的适应性,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法,该算法首先将语音信号进行小波变换,利用小波系数去噪,然后选择小波部分子带跟踪信号的能量变化以分割语音与静音,仿真实验表明该算法在低信噪比条件下也能够有效分割语音。  相似文献   

15.
提出一种基于极值域均值模式分解最大相似度的低信噪比语音增强算法,解决部分噪声环境下低信噪比语音信号增强问题。该算法核心思想是:对分解后得到的固有模态分量进行筛选后再做滤波处理,以此减少过滤波和欠滤波情况的发生。在筛选过程中,提出一种最大相似度判断算法,通过检测得到的噪声信号与固有模态分量计算最大相似度,通过最大相似度筛选出固有模态分量进行滤波,由于噪声与语音信号容易发生频谱混叠,在滤波器的选择上采用时域滤波器。将滤波后的固有模态分量和未作处理的固有模态分量进行信号重构,得到增强后结果。  相似文献   

16.
针对语音信号在离散余弦变换基上的稀疏性,提出了一种基于压缩感知的语音压缩编码算法。算法在编码端采用随机高斯矩阵直接对语音波形进行观测,并采样均匀量化技术对随机观测进行量化。解码端利用未饱和的观测值通过Lasso算法实现语音信号的重构。仿真结果表明,该算法具有良好的重构性能。  相似文献   

17.
提出了一种基于平均路径长度的语音识别算法.采用的识别方法属于小词汇量孤立词语音识别,主要包括端点检测、特征提取和模式识别.首先,在对语音信号预处理的基础上,采用梅尔频率倒谱系数(MFCC)为特征参数提取算法,动态时间规整(DTW)作为识别算法;然后,结合基于平均路径长度的模板训练方法,即采用少量样本,通过计算平均路径长...  相似文献   

18.
主要介绍了几种小波变换去噪的原理及语音增强的算法,并通过Matlab仿真结果证明了小波变换在人声语音增强方面的优良特性。  相似文献   

19.
获取复杂声学背景下的语音流以得到有用信息是一些部门极其重要的工作.研究了在无线话带通信中实现语音流的机器自动检出.结合人的听觉外周和听觉心理的研究,提出了一种基于人耳听觉感知特性的噪声环境下语音流检测方法.该实验采用来自现场的大量的无线话带录音作为测试数据,结果表明,这种新的方法可很好地排除各种噪声的干扰,强噪声环境下表现良好.无论在抗噪方法还是在实际应用中,都有很好的应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号