共查询到20条相似文献,搜索用时 78 毫秒
1.
介绍一种新的DCT计算方法,它以DHT为基础,利用Hopfield神经网络的并行特征来提高DCT的计算性能。该方法与现有方法比较,复杂度降低,乘法运算量为(2N-1),加法运算量为3N-2,并且适合任意长度的DCT计算,因而在图像处理中具有较好的应用前景。 相似文献
2.
3.
4.
5.
穆明生 《南京邮电学院学报(自然科学版)》1997,17(4):65-68,76
给出了一种快速计算离散余弦变换的递归算法结构。该结构给出了用两个2^N-1点DCT去代替2^ 蝶CT,在此基础上,提出了一种简单实用的用开关控制的DCT/IDCT相结合的实现结构,在该 ,仅有正系数的乘法运算和基本的蝶形运算。 相似文献
6.
7.
本文简要介绍了四类离散余弦变换,以第二类离散余弦变换的快速算法为基础,从公式上推出了第四类离散余弦变换的快速算法,在运算次数上与直接计算进行了比较,并给出了相应的C程序。 相似文献
8.
9.
10.
可重构密码流体系结构是一种面向密码运算的新型体系结构,但存在着超长指令字(VLIW)代码稀疏和Kernel体积过大的问题。该文以可重构密码流处理架构S-RCCPA为研究平台,通过大量密码算法在S-RCCPA架构上的适配分析,提出了VLIW可重构技术,并设计了Kernel级指令集、VLIW可重构算法及指令可重构单元。实验证明,该技术能够有效提高VLIW的指令密度,同时降低了VLIW的指令宽度,使得整个Kernel体积减小了约33.3%,并将微码存储器的容量由96 kB降为64 kB,有效降低芯片整体面积和系统功耗。 相似文献
11.
12.
13.
本文针对科学应用中基本函数种类多、实现复杂、使用频率低的特点,提出一种定制VLIW结构四精度浮点基本函数协处理器(QPC-Processor).该结构通过显示并行技术挖掘基本函数实现算法的并行性,在同一硬件平台上通过元操作的不同组合来计算多种基本函数.同时,本文还提出基本函数元操作序列到定制VLIW指令的映射算法,指导基本函数的设计.最后,在FPGA平台上进行验证.实验结果表明,相对软件实现,单个QPC-Processor能够取得6倍以上的加速比,而且,QFC-Processor在同一硬件平台上实现多种类型的算法,弥补单一算法的不足,获得较高的硬件资源利用率. 相似文献
14.
离散余弦变换(DCT)是数字图像处理等许多领域的重要数学工具.本文通过一种新的傅立叶分析技术——算术傅立叶变换(AFT)来计算DCT.本文对偶函数的AFT进行了改进.改进的AFT算法不但把AFT所需样本点数减少了一半,从而使所需加法计算量减少了一半,更重要的是它建立起AFT和DCT的直接联系,因而提供了适合用于计算DCT的AFT算法.本文推导了用改进的AFT计算DCT的算法并对算法进行了简要的分析.这种算法的乘法量仅为O(N),并且具有公式一致,结构简单,易于并行,适合VLSI设计等特点,为DCT的快速计算开辟了新的途径. 相似文献
15.
一种基于DCT的图像水印算法 总被引:1,自引:0,他引:1
数字水印技术是一种在开放的网络环境中用以保护版权和认证来源及完整性的新技术.针对如何解决水印不可见性和鲁棒性矛盾这一问题提出了一种新的水印方案.实验结果表明,算法具有良好的不可见性,对常见的图像处理操作,如JPEG压缩、低通滤波、噪声攻击等具有较强的鲁棒性. 相似文献
16.
This paper presents a 2-D DCT/IDCT processor chip for high data rate image processing and video coding. It uses a fully pipelined
row–column decomposition method based on two 1-D DCT processors and a transpose buffer based on D-type flip-flops with a double
serial input/output data-flow. The proposed architecture allows the main processing elements and arithmetic units to operate
in parallel at half the frequency of the data input rate. The main characteristics are: high throughput, parallel processing,
reduced internal storage, and maximum efficiency in computational elements. The processor has been implemented using standard
cell design methodology in 0.35 μm CMOS technology. It measures 6.25 mm2 (the core is 3 mm2) and contains a total of 11.7 k gates. The maximum frequency is 300 MHz with a latency of 172 cycles for 2-D DCT and 178
cycles for 2-D IDCT. The computing time of a block is close to 580 ns. It has been designed to meets the demands of IEEE Std.
1,180–1,990 used in different video codecs. The good performance in the computing speed and hardware cost indicate that this
processor is suitable for HDTV applications.
This work was supported by the Spanish Ministry of Science and Technology (TIC2000-1289).
相似文献
相似文献
17.
Several parallel, pipelined and folded architectures with different throughput rates are presented for computation of DCT, one of the fundamental operations in image/video coding. This paper begins with a new decomposition algorithm for the 1-D DCT coefficient matrix. Then the 2-D DCT problem is converted into the corresponding 1-D counterpart through a regular index mapping technique. Afterward, depending on the trade-off between hardware complexity and speed performance, the derived decomposition algorithm is transformed into different parallel-pipelined and folded architectures that realize the butterfly operations and the post-processing operations. Compared to other DCT processor, our proposed parallel-pipelined architectures, without any intermediate transpose memory, have the features of modularity, regularity, locality, scalability, and pipelinability, with arithmetic hardware cost proportional to the logarithm of the transform length. 相似文献
18.
以DCT(Discrete Cosine Transform)的实现为例,利用Catapult C探索不同的设计架构,快速设计出性能、面积和功耗之间折衷的最佳实现方案,并与传统的手工编写VHDL代码实现方式进行比较。 相似文献
19.
20.
针对条码印刷防伪应用,提出一种条码印刷防伪算法,使水印对一次打印扫描具有鲁棒性,对二次打印扫描具有脆弱性,以区分原始载体作品的真伪。根据条码水印图像的大小对载体图像进行分块DCT变换,选取中低频系数,同时对这些系数幅值小的进行放大修改,并通过修改系数符号的正负性来嵌入二值条码水印。根据嵌入水印后图像的分块DCT系数的正负性来提取水印,水印提取过程实现了盲提取。通过设定合适的阈值可以判断原图像真伪。仿真实验验证了算法具有很好的不可见性,符合印刷品防伪技术的要求。 相似文献