首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
率失真优化(RDO)策略在视频编码体系中对编码效率有着重要影响。当前主流的率失真优化策略以MSE或类似的方法描述失真,不能很好反映人眼的主观感受。为了提高视频编码的主观感知质量,首先建立一种新的感知失真模型。该模型利用人眼对纹理和亮度的敏感特性,使评价结果能够更好地反映主观质量。在此基础上,提出一种基于纹理和亮度感知特性的率失真优化策略,简称TL-RDO(texture and luminance based RDO)策略。该策略对不同的区域自适应地调整拉格朗日乘子,使得编码结果更好地符合人眼的观察特性。实验结果表明,TL-RDO相比现有最常用的QP-RDO方法,编码效率显著提高;与一些典型的基于感知失真特性的率失真优化策略相比,TL-RDO策略计算复杂度较低,适合于实时编码系统。  相似文献   

2.
利用小波系数的相似性,提出一种基于人眼视觉特性的小波域分形混合图像编码方法。该方法是将图像进行小波分解,按照人眼对于图像边缘区、平滑区、纹理区敏感程度的不同,给这三种不同区域内图像信息所对应的小波系数赋予不同视觉权值,并分别进行分形编码。实验结果表明在保证优先编码视觉上最重要系数的同时,能够进一步提高图像复原质量。  相似文献   

3.
为了更好地提高视频编码效率与视频处理的性能,考虑人眼对不同内容的感知特性和掩蔽效应,以及时域人眼视觉特性,提出一种基于人眼视觉特性的视频客观质量评价算法.首先利用三维Sobel矩阵提取时空特性划分区域,并结合恰可察觉失真视觉阈值与绝对差值图来提取感兴趣区域;然后对感兴趣区域进行感知加权,并利用线性加权进行空间域融合;最后结合时域人眼视觉特性,利用低通函数模拟人眼的不对称感知,并通过最差情况加权策略得到视频序列客观质量评价值.在LIVE视频质量数据库上的实验结果表明,该质量评价算法具有较好的评价性能,更接近于主观测试结果.  相似文献   

4.
基于人眼视觉特性的彩色图象分割方法   总被引:4,自引:0,他引:4  
提出一种基于人眼视觉特性的彩色图象分割方法,不但考虑图象在各颜色坐标系下的分类,而且考虑图象色彩的相似度情况下图象的分类,实验证明,该方法能够避免过分割现象,更能被人眼的视觉感官所接受。  相似文献   

5.
在分析图像小波分解系数的树结构关系以及人眼视觉系统 (HVS)模型的基础上 ,提出了一种基于人眼视觉特性的小波系数树量化水印 ,该方法在宿主图像的两棵小波系数树中嵌入一位水印信息 ,通过量化使它们呈现足够大的统计差别从而使水印检测时能提取水印信息 .实验结果和分析表明 :该方法水印有较好的不可视性和鲁棒性 ,检测水印的虚警概率很低  相似文献   

6.
原直方图均衡化算法处理结果不理想,主要是图像灰度域上实现的均衡化并不代表人眼感知亮度域上的均衡化,对此提出人眼感知亮度域上的直方图均衡化算法,但由于使用的灰度人眼感知模型不准确,处理效果也没有得到明显的改善。提出一种灰度人眼感知模型的建模方法,利用实验测试的方法得到人眼视觉系统临界可见偏差曲线;再推导得到人眼对不同灰度背景下同等灰度差别的敏感度曲线;接着利用上一步结果再通过积分和归一化方法得到灰度人眼感知模型;根据以上灰度人眼感知模型对直方图均衡化算法进行改进。对比实验结果表明,提出算法相比于原直方图均衡化具有明显的改善效果,相比于CLAHE、BBHE以及HMF等直方图改进算法,也具有无需参数调节,增强效果显著和适应性强等优点。  相似文献   

7.
路平  张地  肖俊峰  毕科 《计算机科学》2022,(10):176-182
获取立体视觉信息是人们感知世界的基本能力之一,其中运动立体视觉信息的获取不仅是生物视觉系统在动态世界中生存的关键能力,也是人工视觉系统高效处理立体视频的重要手段。为了设计出贴合人眼视觉特性的3D深度运动感知模型,需要明确挖掘人类对立体运动感知的显著特征后再设计主观实验。文中根据单目和双目线索设计了立体运动视觉刺激视频,并采用控制变量的方法,分别探究了目标球体运动速度、参考球体旋转半径及被试正确感知的相互关系,并分析了目标运动方向与被试感知方向之间的关系。首先对实验条件进行探究,结果发现目标与参考的相对距离越小拦截成功率越高,该结果表明目标同参考之间的相对位置关系会影响被试的感知正确性。其次,采用了拦截成功百分比和感知偏差两个行为测量标准对被试感知能力进行分析,结果发现相比横向运动,深度运动正确感知的成功率超出约42.67%~47.01%。这表明不同运动方位的感知不对称,且深度运动带来的视觉刺激更明显。该研究探索了人类对运动感知的显著特征,并为后续设计3D运动感知模型提供了一种新的判断模型感知效果的主观对比标准,使原有立体感知能力的指标更加细化。  相似文献   

8.
针对现有计算机真实感图形学及虚拟现实主流显示算法不能表现当环境光强骤变时人眼对场景感知变化的缺陷,提出并实现了一个基于人眼感光细胞亮度响应机制的明暗适应过程模拟的增强显示新算法.该算法首先针对人眼中视锥细胞和视杆细胞不同的生理反映机制,利用了双边滤波方法建立起感光细胞接受光刺激后同周边细胞之间的作用关系模型,然后在不同亮度环境下建立起亮度随时间响应的变化模型.结合图像高动态范围图像的色调映射处理模型及实验心理学中的经验模型,并经实验调整不同环境亮度下的生理适应值,通过逆响应变换及颜色适应变换,最终在三维场景中较为逼真地模拟出人眼在明暗适应过程中的对场景的动态感知变化.  相似文献   

9.
基于感知度量的分形编码   总被引:6,自引:0,他引:6       下载免费PDF全文
传统的分形编码利用最小均方差准则(MMSE)来度量图象子块的变换匹配,未能充分利用人眼的视觉特征。本文提出了基于人眼视觉模型的分形编码方案。算法中,按视觉上的差异对图象子块进行分类;由“视觉最相似”的准则确定最佳匹配的域块,为此,相似匹配转换到DCT域进行,导出了图象块的相似匹配在DCT域的形式;算法进一步通过自适应误差校正来消除解码图象中的方块效应。解码图象的视觉质量有了明显的改善。实验结果证实了算法的有效性。  相似文献   

10.
宋辉  王忠民 《计算机科学》2017,44(2):313-316
为了提高移动用户行为识别的准确率,提出一种基于压缩感知的行为识别方法,其可对原始加速度数据或压缩后的加速度数据进行行为识别。依据压缩感知理论中可以由冗余字典重构数据的原理,将原始三轴加速度数据作为训练样本构造冗余字典,基于该字典求解最小l1范数得到待识别样本的稀疏系数,根据稀疏系数计算并选取最小残差值对应的行为作为识别结果。实验结果表明,该方法识别移动用户行为的准确率可达82.64%,高于传统方法的识别准确率,且对随机投影压缩后的行为数据也具有良好的识别效果。  相似文献   

11.
Perceptual audio coding achieves a high compression ratio by exploiting the perceptual irrelevance and data redundancies. By using advanced and sophisticated signal processing methods, perceptual coding has generated artifacts that are quite different from the traditional distortions. A new audio technology becomes mature through the successful modeling, measuring, and control on the artifacts incurred from the technology. With the advance of new coding modules in advanced audio coding (AAC), spectral band replication (SBR), and parametric coding, the incurred artifacts are far more difficult to model, measure, and control than those caused by previous encoding systems like pulse code modulation. This paper models the audible artifacts through the time-frequency diagrams, considers the artifacts-susceptible music types, and analyzes the critical encoding technologies incurring these artifacts.  相似文献   

12.
提出了基于区域联合编码的小波图像压缩方法,适合于编码纹理图像。该算法充分地利用了小波系数的带内特性,根据小波系数的概率分布特性提出区域联合编码算法,算法复杂度低。实验结果表明,该算法在编码纹理图像时编码性能优于目前最成功的小滤零树编码SPIHT算法,编码缓变图像时性能逼近SPIHT算法。  相似文献   

13.
无线环境的特殊性导致传统的关键字检索方法不能很好地用于周期数据广播之中.倒排表是全文检索中广泛使用的一种索引技术,但倒排表索引和基于哈希的数据索引无法解决索引结构过大的问题.为此,在周期数据广播环境下,提出一种新型的关键字索引结构,对倒排表进行编码压缩,缩减索引结构来减少访问时间和调谐时间.同时,与编码压缩索引相结合,设计一种周期数据广播下的文档调度方法.在真实数据集上进行的实验结果表明,该方法可缩减索引结构的规模,降低访问延迟和能耗.  相似文献   

14.
人脸压缩技术在有着广泛应用前景,同时也是非常具有挑战性的问题.本文提出了一种新的基于形状与纹理的人脸正脸的压缩方法.该压缩方法利用主分量分析(PCA)分别建立人脸的形状库与纹理库.压缩时,首先提取待压缩正脸图象的形状信息和纹理信息,利用训练库进行投影变换,最后进行量化和熵编码.基于本文的压缩方法,对于人脸面部信息压缩可以达到很高的压缩比.在相同的压缩比下,本文方法视觉效果远高于基于DCT压缩方法、小波方法和普通PCA方法,同时也具有更高的PSNR.  相似文献   

15.
16.
文章利用小波变换多分辨分解特点和Shapiro提出的EZW编码的优点,实现了一种基于零树结构的可伸缩性编码新方法,其编码特点是可以输出分辨率多位率压缩位流,有效地改进了EZW方法只能应用于单一分辨率视频服务的不足。该算法首先对小波变换系数进行一致标量量化;其次对量化后不为零的重要低频系数按照位平面次序进行编码;最后根据零树结构对高频小波系数,从低分辨率开始逐频带搜索得到不为零的重要系数,对搜索到的高频重要系数同样按照位平面次序进行编码,直至最高频带小波系数。该算法的特点是具有可伸缩性,即其编码位流不但可以进行多分辨率解码,而且可以进行多位率解码。实验结果表明,该压缩方法性能优于Shapiro的EZW方法,能在一定程度上提高峰值信噪比(PSNR)。  相似文献   

17.
文章利用小波变换多分辨分解特点和Shapiro提出的EZW编码的优点,实现了一种基于零树结构的可伸缩性编码新方法,其编码特点是可以输出分辨率多位率压缩位流,有效地改进了EZW方法只能应用于单一分辨率视频服务的不足,该算法首先对小波变换系数进行一致标量量化;其次对量化后不为零的重要低频系统按照位平面次序进行编码,最后根据零树结构对高频小波系数,从低分辨率开始逐频带搜索得到不为零的重要系数,对搜索到的高频重要系数同样按照位平面次序进行编码,,直至最高频带小波系数,该算法的特点是具有可伸缩性,即其编码位流不但可以进行多分辨率解码,而且可以进行多位率解码,实验结果表明,该压缩方法性能优于Shapiro的EZW方法,能在一定程度上提高峰值信噪比(PSNR)。  相似文献   

18.
使用了一种新分片线性逼近算法,算法首先对极大极小友谊赛一分片线性函数的紧凑表示形式做了改进,然后发挥了分片线性逼近的优势。在此基础上,提出了一种基于分片线性逼近的图象压缩编码方法。这种方法具有解压缩速度快的优点,与其它的图象压缩方法(例如DCT)相结合,能够提高图象的压缩效率。  相似文献   

19.
一种基于动态量化编码的深度神经网络压缩方法   总被引:1,自引:0,他引:1  
饶川  陈靓影  徐如意  刘乐元 《自动化学报》2019,45(10):1960-1968
近年来深度神经网络(Deep neural network,DNN)从众多机器学习方法中脱颖而出,引起了广泛的兴趣和关注.然而,在主流的深度神经网络模型中,其参数数以百万计,需要消耗大量的计算和存储资源,难以应用于手机等移动嵌入式设备.为了解决这一问题,本文提出了一种基于动态量化编码(Dynamic quantization coding,DQC)的深度神经网络压缩方法.不同于现有的采用静态量化编码(Static quantitative coding,SQC)的方法,本文提出的方法在模型训练过程中同时对量化码本进行更新,使码本尽可能减小较大权重参数量化引起的误差.通过大量的对比实验表明,本文提出的方法优于现有基于静态编码的模型压缩方法.  相似文献   

20.
余波  简炜  陈建勋  孙希平 《微计算机应用》2007,28(12):1316-1320
图像作为最常见的信息存储方式,其表现形式生动而直观,能提供比其它形式数据更多的信息。但数字图像通常包含巨大数量的信息,若不经过压缩,数字图像传输所需的高传输速率和数字图像存储所需要的巨大容量会阻碍数字图像的发展。因此,对图像进行压缩十分必要。文章设计一种基于正交多项式分段拟合的图像压缩编码方法,以探索新的图像压缩编码方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号