首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
蒙哥马利算法是在RSA密码系统中广泛应用的模乘法算法。该文介绍蒙哥马利算法到脉动阵列的映射过程,阐述了从算法到脉动阵列的规范映射方法。阵列的时钟周期长度大致是两个单位全加器延迟,n位模乘法的计算延迟是2n+2个时钟周期。模块化、规则化、通信局部化等特征,使得脉动阵列特别适合采用深亚微米VLSI技术实现,并获得很高的工作频率,从而提高处理速度。  相似文献   

2.
视频技术发展要求更高速,更利于硬件实现的运动估计算法.提出了一种蝶形运动估计算法,该算法采用蝶形搜索模板、快速截止技术和运动向量预测技术.该算法较钻石搜索算法提速43.26%-80%,并且图像质量更好.同时,本文采用加法树和片内并行存储器,构建该算法的VLSI实现结构.通过两种数据映射方法(拉丁方映射和4×4块映射),该结构不但解决了快速搜索算法的数据不规则性难题,并且节省了带宽.当系统时钟为27MHz,数据总线为16位,外部存储器带宽要求仅为4.57Mbit/s.比较其它硬件实现结构,该结构采用了更少的处理单元数,更小的缓存单元,但却获得更快的速度和更高的灵活性.  相似文献   

3.
针对嵌入式系统软硬件协同设计中的软硬件划分问题,提出了一种基于分布估计算法的解决方案,通过将算法映射到一般结构Gauss网络上,提高了算法的稳定性和搜索效率.结果表明,该算法有效地解决了软硬件划分问题.  相似文献   

4.
一种基于FBMA算法的整像素运动估计芯片的VLSI设计   总被引:2,自引:0,他引:2  
给出了一种基于全搜索块匹配算法的运动估计电路的改进结构,并完成了VLSI设计.通过采用多端口匹配策略和双时钟方案,使得在提高先前帧搜索区域像素数据重复利用率的同时,将脉动阵列的计算效率提高到74.9%.采用TSMC0.25μm1P5MCMOS工艺,完成了运动估计芯片的VLSI实现,其芯片面积为3.37mm×3.37mm,最高工作频率为110MHz.综合后仿真表明在89.4MHz的频率下,该电路可以对支持MPEG4ASProfile标准的ITUR601格式视频图像(720×480@30HzNTSC或720×576@25HzPAL)进行基于整像素的实时运动估计.  相似文献   

5.
脉动阵列结构规整、吞吐量大,适合矩阵乘算法,广泛用于设计高性能卷积、矩阵乘加速结构。在深亚微米工艺下,通过增大阵列规模来提升芯片计算性能,会导致频率下降、功耗剧增等问题。因此,结合3D集成电路技术,提出了一种将平面脉动阵列结构映射到3D集成电路上的双精度浮点矩阵乘加速结构3D-MMA。首先,设计了针对该结构的分块映射调度算法,提升矩阵乘计算效率;其次,提出了基于3D-MMA的加速系统,构建了3D-MMA的性能模型,并对其设计空间进行探索;最后,评估了该结构实现代价,并同已有先进加速器进行对比分析。实验结果表明,访存带宽为160GB/s时,采用4层16×16脉动阵列的堆叠结构时,3D-MMA计算峰值性能达3TFLOPS,效率达99%,且实现代价小于二维实现。在相同工艺下,同线性阵列加速器及K40GPU相比,3D-MMA的性能是后者的1.36及1.92倍,而面积远小于后者。探索了3D集成电路在高性能矩阵乘加速器设计中的优势,对未来进一步提升高性能计算平台性能具有一定的参考价值。  相似文献   

6.
为解决提高RSA算法的加密速度保证加密的安全性,提出了在FPGA上实现RSA算法.通过分析RSA算法将该算法分解成模乘运算,模乘的求解采用改进的蒙哥马利算法实现,并通过脉动阵列的方式消除蒙哥马利算法中的长整数进位,有效降低了延迟提高加密速度.同时为了降低FPGA的资源占用,RSA算法采用流水线方式实现脉动阵列,并通过软硬件的协同合作完成算法中素数的判定生成算法参数.在FPGA上下载验证1024位的RSA算法,实验结果表明,采用上述方式实现的RSA算法能占用较少的资源并达到较快的加密速度.  相似文献   

7.
脉动变换的一个新的快速搜索算法   总被引:1,自引:1,他引:1  
介绍了搜索脉动变换的一个快速方法,使用数据相关性法将循环算法映射成脉动阵列,主要任务是搜索脉动变换T-[∏,S],为此需要对选定的∏和所有可能的矩阵K解方程SD=PK,本文指出如下事实并依据该事实提出一个搜索变换S的新方法:如果变换S满足[0…0 0…0]≤SD≤[L L]其中L=[[∏δ1/2]]……[[∏δm/2]]。则存在矩阵K满足方程SD=PK。因此通过验证不等式即可得出变换S,避免了矩阵K的枚举和反复解方程组SD=PK,使搜索效率显著提高。  相似文献   

8.
基于分段线性混沌映射的算术编码与加密   总被引:1,自引:0,他引:1  
为了提高数据的编解码速率和传输安全,根据迭代斜帐篷映射的反函数可以作为算术编码,提出了基于分段线性混沌映射的算术编码与加密方案。方案将加密嵌入编码过程中,解决了现存方案中编码与加密独立分离的问题,实现了同步编码与加密。结果表明,算法提高了编码效率和密文的不可预测性,并且可以有效抵御选择性明文攻击、短明文攻击和蛮力搜索攻击。  相似文献   

9.
免疫算法与遗传算法都存在的不成熟收敛问题。混沌优化方法是近年出现一种新的优化技术,通常使用Logistic或Tent映射产生混沌序列进行搜索,Logistic映射产生的混沌序列的概率密度函数切比雪夫型分布,当最优值落在[0,1]的中间位置时,这种分布特性会影响全局搜索能力和效率。而Tent映射也存在迭代易落入小周期循环的问题。针对免疫算法和混沌优化算法中存在的缺陷,该文用变尺度的搜索策略,提出了一种基于Hénon映射的自适应克隆选择的优化算法,数值仿真结果表明,该文提出的算法提高了局部搜索的能力及其计算效率,算法可行有效。  相似文献   

10.
本文将FP代数,重写理论与脉动阵列(Systolic Arrays)的设计结合起来,研究了脉动阵列的形式化设计和自动综合的问题。文章中提出的FP/B并发计算型,不但可表示某一类FP/B递归方程的展开式解,而且可以用来等价地对算法进行重新描述,从而开发了计算的并行性和流水线性,获得一个规整高效的计算结构。文章形式地用FP/B定义了脉动式,并根据FP/B代数,建立了具有终止性和保持正确性的脉动阵列重写系统,它能将用户FP/B程序自动转换为等价的脉动式,再根据FP/B并发计算型及一些函数的几何语义可较为直接地获得一个脉动阵列的硬件描述。文末给出一个例子加以说明。  相似文献   

11.
MODV是一个通用的存储一致性模型动态验证工具,该工具实现了基于时间序的边界图算法,具有较低的时间复杂度.为了进一步提高MODV工具的性能,我们采用了多种方法对算法进行了性能优化,使得MODV工具能够有效验证更大规模的并发访存操作.实验结果表明,和基准算法相比,我们的改进算法在性能方面有较大的提升.  相似文献   

12.
在包层次的代码重构研究中,为了得到"高内聚、低耦合"的软件结构,层次聚类算法因其简单有效、聚类精度高等特点被认为是一种较好的软件聚类方法.但是,层次聚类算法时间复杂度高,不利于处理较大规模的软件.而基于密度聚类的DBSCAN算法则与之相反,具有较快的聚类速度,但是精度却较低.因此,提出一种基于DBSCAN的软件层次聚类...  相似文献   

13.
本文讨论了动态矩形交查询算法.文中介绍了两个半动态矩形查询的新算法,它们分别基于一维数据结构和二维数据结构.一维查询算法的查询时间复杂度是O(logMk′),更新时间复杂度是O(logMlogn),空间复杂度是OnlogM/).二维查询算法的查询时间复杂度是O(log2Mk),更新时间复杂度是O(log2Mlogn),空间复杂度是Onlog2M).本文分别实现了这两个算法,通过对它们的性能进行比较,发现一维查询算法是一种高效、实用的算法.  相似文献   

14.
蔡君  余顺争 《计算机应用研究》2013,30(12):3560-3563
根据网络节点的局部拓扑信息构建稀疏相似网络。基于稀疏相似网络, 提出了一种改进后的随机聚类采样算法对网络社团进行探测。在人工和真实网络上, 将算法与未改进的随机聚类采样算法以及几种典型的社团探测算法进行了准确率和时间复杂度的比较。实验结果表明, 该方法在时间复杂度上具有明显的优势, 并且具有较好的准确率。  相似文献   

15.
遗传算法和Dijkstra算法在动态权值系统中的比较   总被引:1,自引:0,他引:1  
针对遗传算法和Dijkstra算法在求解动态权值系统中最短路径时的性能问题,采用比较法,将两种算法应用在同一个实际游戏模型中,对其算法的稳定性、智能性、时间复杂度进行对比测试。游戏模型模拟了各种条件下的动态权值系统。为了使遗传算法更加可靠,通过优化其变异过程使得收敛速度更快,可靠性更高。实验数据表明,遗传算法在每张地图上的得分数以及算法所用时间普遍高于Dijkstra算法,从而得出遗传算法在求解动态权值系统中最短路径问题时稳定性和预期效果明显好于Dijkstra算法,但其时间复杂度较高的结论。  相似文献   

16.
重叠网络的社区发现是复杂网络研究中的重要问题。为了提高网络中重叠社区发现的时间效率,提出一种基于边图的线性流重叠社区发现算法LBSA。算法首先对于边图网络中的边进行随机的依次处理,完成节点的初步社区划分,再将其中重叠小社区合并到相似度最大的其他大社区中得到最终的社区。通过以上步骤,算法能够以接近线性的时间复杂度得到网络的重叠结构。从最终的实验结果来看,与其他算法相比,该算法能够在更短的时间有质量地发现网络中的重叠社区。  相似文献   

17.
随着芯片复杂度以及市场对集成电路上市时间要求的不断提高,对SoC设计方法和验证方法带来了巨大的挑战。控制数据流图可用于系统建模、软硬件功能划分、系统综合与验证等多个环节。该文针对SoC验证的需要,利用CDFG,研究了基于CDFG的验证体系,给出了CDFG的几种定义,讨论了CDFG的表示方法,提出了基于CDFG的验证流程,研究了基于DFS的生成树算法、CDFG的分割算法和CDFG的搜索算法,并以实例说明了这些算法在验证流程中的作用。  相似文献   

18.
针对中心化域名安全扩展(Domain name system security extensions, DNSSEC)架构所导致的信任链复杂性和单边控制模式, 提出了一种去中心化的DNSSEC公钥验证机制. 该机制结合区块链结构、密码学累加器和共识算法设计, 创新性地实现使用区块链技术的密钥绑定、轮转和验证操作, 无需中心化权威节点即可使用可信公钥验证域名记录. 进一步分析和实验表明, 所提出的机制在保证密钥管理安全性的同时, 提高了密钥验证的效率.  相似文献   

19.
结合颜色和梯度信息的稀疏图像修复算法   总被引:2,自引:0,他引:2  
现有基于稀疏性的图像修复算法仅利用颜色信息衡量样本块的相似度,易降低修复区域内结构部分的连通性及与邻域信息的连续一致性,同时在全局范围内搜索匹配块也增加了算法的运行时间.为解决上述问题,利用颜色与梯度模值信息度量样本块之间的距离,构造新的相似度以确定块结构稀疏度函数,利用块结构稀疏度确定填充顺序,同时构造新的匹配准则函数寻找匹配块;并利用块结构稀疏度值能够较好地反映样本块所处区域特征的特性,根据块结构稀疏度值自适应确定局部搜索区域大小.并通过实验验证在不同图像中颜色信息与梯度信息所占比例不同.实验结果表明,该算法较对比算法能够更好地保持结构部分的连贯性及与邻域信息的连续一致性,在峰值信噪比上至少提高1dB,并且算法速度提高4~11倍.  相似文献   

20.
文章介绍了IP分类技术研究的最新成果,以及IP分类的典型算法。提出了一种基于哈希(Hash)和跳转表Trie树JTTT(JumpingTableTrie-Tree)的IP分类算法,该算法和核心有两点:一是将源/目的端口和协议三域构造成一个哈希函数,因为该三域的交叉组合较少;二是将源/目的IP地址分割为两块构成跳转表和Trie树。通过分析比较,文章提出的算法无论是时间性能还是空间性能均优于GridofTries算法,文中通过仿真给出了最终的分类效果。最后该文对提出的算法在虚拟环境下做了评判。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号