共查询到20条相似文献,搜索用时 31 毫秒
1.
本文从实用角度出发,提出了一种基于时域和频域的特征参数提取算法,利用感知哈希函数和线性预测参数得到特征参数。感知哈希函数是语音数据到数字摘要的一类单向映射,具有相同感知的语音数据表示唯一地映射为一段数字摘要,这样使得参数匹配起来更加准确容易。针对这种特征参数,本文采用隐马尔可夫模型对语音进行识别,在仿真实验的基础上,将该算法移植到树莓派嵌入式平台上,最后通过实际测试,表明该算法能达到较高的准确率,具有一定的可行性。 相似文献
2.
感知哈希(Perceptual Hashing)是多媒体数据集到摘要集的单向映射,为多媒体数字内容的标识、检索、认证等应用提供了安全可靠的技术支撑.本文提出一种融合视觉感知及时空域特征的视频感知哈希算法.算法首先对视频序列每一帧进行随机可重叠分块,并计算每个分块以像素为单位的亮度均值,在某一步长下,以同一帧的分块亮度差作为视频帧空域特征,以不同视频帧相同位置的分块亮度差作为时域特征,通过哈希量化得到时空域感知哈希,通过时空域感知哈希融合,最后得到简洁的视频唯一标识——摘要哈希.实验结果表明,该算法表现出较好的鲁棒性与区分性,通过相似度拟合图算法分析,可以实现视频篡改的准确检测及定位. 相似文献
3.
在信息安全相关研究中,图像哈希算法是一项热门的内容,通过一串短效的字符、数字序列,对一副图像进行映射,在数字水印、图像检索、图像索引、图像认证等方面,均有着广泛的应用.哈希算法的两个基本性质就是感知鲁棒性、惟一性.传统的密码学哈希算法,一般仅适用于文本数据,需要设计开发新的哈希算法,用于图像等多媒体数据的处理.基于此,本文基于数字图像,提出了基于压缩感知的图像哈希算法,分别以颜色向量角、环形分割为切入点,对图像哈希算法进行了研究. 相似文献
4.
提出了一种基于小波变换的鲁棒性基音周期检测方法。首先结合平均能量频带分布和短时过零率这两个特征参数对语音信号进行清浊音判决,然后对浊音段采用空域相关函数提取基音周期。实验表明,与传统的小波变换和自相关算法相比,该方法鲁棒性好,对基音检测具有更高的准确性。 相似文献
5.
图像感知哈希(Perceptual Hashing)是一门新兴技术,它通过对图像感知信息的简短摘要和基于摘要的匹配,来支持图像的认证和识别,具有广泛的应用前景.目前关于图像感知哈希的研究主要集中在图像特征的提取上,但是特征的选择缺乏对人眼视觉特性的考虑.本文从不同的侧面提出几种基于人类视觉系统的图像感知哈希算法.通过这几种算法之间和已有传统算法之间的测试比较,结果表明考虑了人眼视觉特性的图像感知哈希算法在鲁棒性和区分性上能够得到提高,算法给出的感知距离度量更符合人的主观感受. 相似文献
6.
感知哈希(Perceptual Hashing),是多媒体数据集到感知摘要集的一类单向映射,即将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要,并满足感知鲁棒性和安全性.感知哈希为多媒体内容识别、检索、认证等信息服务方式提供安全可靠的技术支撑.本文在人类感知模型(Human Perceptual Model)的基础上,明确了感知哈希的定义、性质和一般性描述.并对目前感知哈希的典型算法、应用模式以及评测基准等进行了综述,指出了感知哈希未来的研究方向. 相似文献
7.
《现代电子技术》2017,(10)
受到图像传输的限制,研究人员还未设计出同时具备较强安全性、鲁棒性,且行之有效的耦合环形区域分割的图像哈希认证算法。因此,提出非负矩阵分解耦合环形区域分割的图像哈希认证算法。所提算法利用高斯平滑滤波电路,除去图像中较为明显的噪音、调节图像亮度,并通过非负矩阵分解通过构建图像耦合环形区域预处理函数,对滤波后的图像进行耦合环形区域分割,完成图像的预处理。在图像的耦合环形区域进行图像哈希认证前,先对耦合环形区域分割结果进行归一化处理,对非负矩阵分解的分割结果进行归纳,减少算法运算量。算法根据归一化处理结果对图像哈希算法流程进行设计。经实验验证表明,所提算法具备较强的安全性和鲁棒性,对增强图像传输清晰度较为有效。 相似文献
8.
9.
10.
11.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。 相似文献
12.
本文提出了一种新的基于Laplacian语音模型的语音增强算法。首先,在假定语音和噪声的短时DCT系数分别服从Laplacian和Gaussian分布的基础上,推导了最小均方误差意义下的语音信号短时DCT系数估计;然后,根据语音存在概率估计,提出了语音信号短时DCT系数估计的修正因子。在增强算法中,提出了面向判决的Laplacian语音模型参数估计和基于Laplacian语音模型的改进最小量控制递归平均(IMCRA)噪声估计算法。仿真结果表明,本文算法不仅在噪声抑制性能方面优于近两年国际上提出的几种基于Gaussian语音模型的语音增强算法,而且在增强语音质量方面也具有更好的性能。 相似文献
13.
基于多元Laplace语音模型的语音增强算法 总被引:1,自引:0,他引:1
传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法在抑制背景噪声和减少语音失真等方面优于传统的语音增强方法。 相似文献
14.
基于改进语音特征提取方法的语音识别 总被引:1,自引:1,他引:0
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值. 相似文献
15.
16.
17.
18.
人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数(DWTMFCC)提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。 相似文献
19.
This paper proposes a voice synthesizer to convert a single speech to multiple speeches. Pitch is an important voice characteristic
of speech parameter and it is produced by the periodic vibration of the vocal-cords; the parameter most sensitive for human’s
auditory sense. So if you change the pitch of the voice with several different scaling rates, you can produce several different
voices at the same time with a voice. The Multiple-Speech Synthesizer will be used in diverse practical applications. The
cheer synthesizer that makes group voice from a single voice would be such an example. You could also use the system for a
troll toy, birthday song tracks, effect sounds in movies and plays, protection systems of houses, etc. Furthermore, the synthesizer
could be used to imitate the voice of famous entertainers or cartoon characters, such as the Mask-man.
相似文献
Myung Jin BaeEmail: |