首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文从实用角度出发,提出了一种基于时域和频域的特征参数提取算法,利用感知哈希函数和线性预测参数得到特征参数。感知哈希函数是语音数据到数字摘要的一类单向映射,具有相同感知的语音数据表示唯一地映射为一段数字摘要,这样使得参数匹配起来更加准确容易。针对这种特征参数,本文采用隐马尔可夫模型对语音进行识别,在仿真实验的基础上,将该算法移植到树莓派嵌入式平台上,最后通过实际测试,表明该算法能达到较高的准确率,具有一定的可行性。  相似文献   

2.
感知哈希(Perceptual Hashing)是多媒体数据集到摘要集的单向映射,为多媒体数字内容的标识、检索、认证等应用提供了安全可靠的技术支撑.本文提出一种融合视觉感知及时空域特征的视频感知哈希算法.算法首先对视频序列每一帧进行随机可重叠分块,并计算每个分块以像素为单位的亮度均值,在某一步长下,以同一帧的分块亮度差作为视频帧空域特征,以不同视频帧相同位置的分块亮度差作为时域特征,通过哈希量化得到时空域感知哈希,通过时空域感知哈希融合,最后得到简洁的视频唯一标识——摘要哈希.实验结果表明,该算法表现出较好的鲁棒性与区分性,通过相似度拟合图算法分析,可以实现视频篡改的准确检测及定位.  相似文献   

3.
在信息安全相关研究中,图像哈希算法是一项热门的内容,通过一串短效的字符、数字序列,对一副图像进行映射,在数字水印、图像检索、图像索引、图像认证等方面,均有着广泛的应用.哈希算法的两个基本性质就是感知鲁棒性、惟一性.传统的密码学哈希算法,一般仅适用于文本数据,需要设计开发新的哈希算法,用于图像等多媒体数据的处理.基于此,本文基于数字图像,提出了基于压缩感知的图像哈希算法,分别以颜色向量角、环形分割为切入点,对图像哈希算法进行了研究.  相似文献   

4.
胡瑛  陈宁 《电声技术》2006,(11):63-66
提出了一种基于小波变换的鲁棒性基音周期检测方法。首先结合平均能量频带分布和短时过零率这两个特征参数对语音信号进行清浊音判决,然后对浊音段采用空域相关函数提取基音周期。实验表明,与传统的小波变换和自相关算法相比,该方法鲁棒性好,对基音检测具有更高的准确性。  相似文献   

5.
基于人类视觉系统的图像感知哈希算法   总被引:2,自引:0,他引:2       下载免费PDF全文
张慧  张海滨  李琼  牛夏牧 《电子学报》2008,36(Z1):30-34
图像感知哈希(Perceptual Hashing)是一门新兴技术,它通过对图像感知信息的简短摘要和基于摘要的匹配,来支持图像的认证和识别,具有广泛的应用前景.目前关于图像感知哈希的研究主要集中在图像特征的提取上,但是特征的选择缺乏对人眼视觉特性的考虑.本文从不同的侧面提出几种基于人类视觉系统的图像感知哈希算法.通过这几种算法之间和已有传统算法之间的测试比较,结果表明考虑了人眼视觉特性的图像感知哈希算法在鲁棒性和区分性上能够得到提高,算法给出的感知距离度量更符合人的主观感受.  相似文献   

6.
感知哈希综述   总被引:8,自引:3,他引:5       下载免费PDF全文
牛夏牧  焦玉华 《电子学报》2008,36(7):1405-1411
 感知哈希(Perceptual Hashing),是多媒体数据集到感知摘要集的一类单向映射,即将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要,并满足感知鲁棒性和安全性.感知哈希为多媒体内容识别、检索、认证等信息服务方式提供安全可靠的技术支撑.本文在人类感知模型(Human Perceptual Model)的基础上,明确了感知哈希的定义、性质和一般性描述.并对目前感知哈希的典型算法、应用模式以及评测基准等进行了综述,指出了感知哈希未来的研究方向.  相似文献   

7.
受到图像传输的限制,研究人员还未设计出同时具备较强安全性、鲁棒性,且行之有效的耦合环形区域分割的图像哈希认证算法。因此,提出非负矩阵分解耦合环形区域分割的图像哈希认证算法。所提算法利用高斯平滑滤波电路,除去图像中较为明显的噪音、调节图像亮度,并通过非负矩阵分解通过构建图像耦合环形区域预处理函数,对滤波后的图像进行耦合环形区域分割,完成图像的预处理。在图像的耦合环形区域进行图像哈希认证前,先对耦合环形区域分割结果进行归一化处理,对非负矩阵分解的分割结果进行归纳,减少算法运算量。算法根据归一化处理结果对图像哈希算法流程进行设计。经实验验证表明,所提算法具备较强的安全性和鲁棒性,对增强图像传输清晰度较为有效。  相似文献   

8.
基于离散小波变换和感知频域滤波的语音特征参数   总被引:11,自引:0,他引:11  
为了提高语音识别系统对环境噪声的鲁棒性,本文通过对几种特征参数的噪声鲁棒性的研究,在感知倒谱分析的基础上,引入了多分辨率小波分析技术,利用小波变换的时频局域性并结合感知频域上的滤波技术,提出了一种新型的语音特征参数,该特征参数对于环境噪声具有很强的耐噪性。  相似文献   

9.
提出了基于Zernike矩和熵特征的数字图像感知哈希算法。算法利用Zernike矩计算参考方向,以计算等面积环块和等角度扇形块内的熵作为感知特征,并通过量化处理构造哈希序列。算法利用哈希码之间的欧氏距离作为图像内容相似性的判定依据。实验结果表明,该算法对加性噪声、JEPG压缩、几何变换等操作具有较好的鲁棒性,且对于内容不同的图像有较好的区分度。  相似文献   

10.
传统的基于短时能量端点检测算法,在高信噪比环境下可以比较准确地检测出语音端点,但在低信噪比环境下检测效果不理想。文中提出了基于短时自相关最大值与短时过零率之积的改进算法。利用短时自相关最大值可以有效地区分出语音段和噪音段,利用短时过零率可有效地检测出清音信号,将两参数相结合可有效地检测出低信噪比语音信号的端点。实验证明,在低信噪比环境下该改进算法相比短时能量算法减小了检测误差,可以有效地检测出语音端点。  相似文献   

11.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。  相似文献   

12.
邹霞  吴其前  张雄伟 《信号处理》2007,23(2):195-199
本文提出了一种新的基于Laplacian语音模型的语音增强算法。首先,在假定语音和噪声的短时DCT系数分别服从Laplacian和Gaussian分布的基础上,推导了最小均方误差意义下的语音信号短时DCT系数估计;然后,根据语音存在概率估计,提出了语音信号短时DCT系数估计的修正因子。在增强算法中,提出了面向判决的Laplacian语音模型参数估计和基于Laplacian语音模型的改进最小量控制递归平均(IMCRA)噪声估计算法。仿真结果表明,本文算法不仅在噪声抑制性能方面优于近两年国际上提出的几种基于Gaussian语音模型的语音增强算法,而且在增强语音质量方面也具有更好的性能。  相似文献   

13.
基于多元Laplace语音模型的语音增强算法   总被引:1,自引:0,他引:1  
传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法在抑制背景噪声和减少语音失真等方面优于传统的语音增强方法。  相似文献   

14.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

15.
16.
针对传统谱减法会产生“音乐噪声”及在低噪比环境下降噪效果不理想的问题,提出一种基于语谱图分析的语音增强算法.所提方法先对带噪语音进行谱减处理,再通过语谱图分析对处理后的语音信号进行去小亮块处理,即对“音乐噪声”进行有效的削弱,最后通过设置阈值,滤除低灰度值的成份,即消除残留近似高斯噪声.实验结果表明,提出的算法可以有效地解决谱减法后残留的“音乐噪声”及低信噪比下谱减法残留噪声较大的问题.  相似文献   

17.
18.
人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数(DWTMFCC)提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。  相似文献   

19.
This paper proposes a voice synthesizer to convert a single speech to multiple speeches. Pitch is an important voice characteristic of speech parameter and it is produced by the periodic vibration of the vocal-cords; the parameter most sensitive for human’s auditory sense. So if you change the pitch of the voice with several different scaling rates, you can produce several different voices at the same time with a voice. The Multiple-Speech Synthesizer will be used in diverse practical applications. The cheer synthesizer that makes group voice from a single voice would be such an example. You could also use the system for a troll toy, birthday song tracks, effect sounds in movies and plays, protection systems of houses, etc. Furthermore, the synthesizer could be used to imitate the voice of famous entertainers or cartoon characters, such as the Mask-man.
Myung Jin BaeEmail:
  相似文献   

20.
本文结合双源激励模型和AM-FM语音表示模型,提出双源谐波模型,给出一套精确分离清音和浊音分量方法,即时域谐波逼近法,为分别提取清音与浊音特征,对清音和浊音以不同的时频分辨率进行分析提供技术条件,而且可以提高系统整体计算效率.新方法特别适合声学和语言学模块的Top-Down和Bottom-Up并行迭代计算的特点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号