首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端. 该任务编译前端通过展开核心循环可提高并行执行度,在数据依赖分析确保运算正确执行的基础上,对循环体内的数组访问进行标量替换,以优化数据传输开销. 实验结果表明,该任务编译前端能有效提高代码并行性和优化数据传输能力,与Garp C编译器的编译前端相比,该任务编译前端设计的性能可提升约2~4倍.  相似文献   

2.
多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序。自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动并行化技术无法取得良好效果。decoupled software pipelining(DSWP)算法针对传统自动并行失败的循环实现了指令级的细粒度并行,但是需要对处理器体系结构和指令集的深入了解,对其并行性能和应用广泛性带来限制。通过对DSWP算法进行改进,提出了基于OpenMP的DSWP自动并行算法。该算法增大了并行粒度,使用OpenMP并行应用编程接口实现并行,不再依赖具体的体系结构,实现了DSWP算法的应用扩展。通过对基准测试集NPB3.3.1的测试表明,传统自动并行失败的循环,经文章算法并行后在双核处理器上平均加速比达到1.23以上;使用添加了文章算法的Open64编译器生成的并行程序,与仅使用传统自动并行方法的Intel编译器和Open64编译器所得程序相比,平均加速比分别高出22%和26%。  相似文献   

3.
聚焦安全关键软件,研究基于PROMELA形式模型验证C程序中违反断言、数组越界、空指针解引用、死锁及饥饿等5类故障技术。建立C程序抽象语法树节点到PROMELA模型,验证属性相关函数到PROMELA模型的2类映射规则;根据映射规则提出由C程序自动生成PROMELA形式模型的算法,并对算法进行理论分析;针对C程序中5种故障类型,分别给出基于PROMELA模型的形式化验证方法,并分析验证的范围;覆盖各类故障的验证范围,为每类故障类型选取12个C程序案例进行实证研究,实验结果证明了方法的有效性。  相似文献   

4.
CFD程序自动并行化的相关性分析和通信策略   总被引:8,自引:1,他引:7  
针对CFD(computational fluid dynamics)问题中的点松弛和线松弛迭代算法,研究其帧内和帧间数据相关性,提出一种数据相关性分析算法和通信策略。与相应的程序重构技术相结合,实现这类程序的SMPD模式的自动并行化。该算法与平台无关,能够适用于消息传递(MP)和共享变量的通信机制,目前已在PVM环境中实现。经测试,基于该算法自动生成的并行程序能够达到很高的并行效率,对于绝大多数  相似文献   

5.
为降低可重构媒体处理器任务编译器设计中系统配置代价,有效提升配置信息的配置效率,提出了一种新的配置信息优化生成方法。该生成方法在对输入的数据流图进行独立子图搜索和子图同构判定得到各类子图的属性的基础上,对配置模板生成步骤增添约束来生成全等的配置模板以提升系统的配置性能。本文方法已被应用到可重构媒体处理器任务编译器的设计实践中。实验结果表明:本文方法能够有效地生成优化的配置信息,所生成的配置信息的配置性能明显优于传统贪婪方法生成的配置信息。  相似文献   

6.
提出了一种基于SOPC(片上可编程系统)的自演化硬件实现的设计方法,并以Virtex-ⅡPro开发板为硬件平台,内嵌的软核处理器Microblaze为控制核心.首先使用VHDL硬件描述语言设计虚拟可重构电路;然后将虚拟可重构电路定制成可进化IP核并通过OPB总线与软核处理器相连;最后在处理器上编写遗传算法程序对定制的可进化核进行进化操作,以一位加法器为例验证了自演化硬件的实现.结果表明,该方法不但可以大大简化染色体编码,便于进化操作,而且软件上操作灵活方便,硬件上又具有可定制性.  相似文献   

7.
该文设计了一种基于全新体系架构的软/硬件任务管理的局部动态可重构嵌入式系统,并在该系统上移植了实时操作系统μC/OS-II,实现了单芯片上软/硬件任务管理的动态部分可重构系统.实验结果表明,硬件任务可以和软件任务一样灵活的实时调度运行,相比于传统的硬件固定系统,资源利用率节约了50%以上,而相比于传统的软件处理器,执行...  相似文献   

8.
ZUC算法是我国自主设计的一个面向字的流密码,是运用于下一代移动通信4G网络中的国际标准密码算法。它采用128位的初始密钥和一个128位的初始向量作为输入,生成32位关于字的密钥流。密钥流可用于对信息进行加解密。本文主要介绍了ZUC算法并用硬件描述语言VHDL进行了硬件实现,在QuartusⅡ开发环境上的仿真结果与中科院发布的测试文件中的数据一致,从而证明了实现结果的正确性。  相似文献   

9.
本文针对基于FPGA硬件设计方法的特点,对DES(data encryption standard)加密算法进行了深入分析,提出了一种基于现场可编程阵列(FPGA)的DES改进算法.该算法采用3级流水线生成子密钥,提高了子密钥的生成速度;采用状态机方法控制子密钥的产生时间,避免出现时钟延时;而且S盒随时间的变化可动态刷新,从而实现牢不可破的"一次一密"的密码体制.最后给出了由VHDL描述语言实现的硬件算法,并在Xilinx Virtex-II Pro平台上进行了仿真实验,结果表明了硬件实现算法的正确性,而且系统硬件资源消耗有所降低,系统的处理速度得到较大提高.因此基于FPGA实现的DES加密算法适用于实时性较强的场合.  相似文献   

10.
为了满足专用指令处理器(ASIP)存储器约束和代码执行的实时性要求,提出了一种同时考虑代码选择和寄存器分配的代码综合生成算法,同步处理代码生成的子问题.该算法基于最优化原理,把无环有向图(DAG)的所有节点构造成一个调度矩阵,把寻找代码优化的问题转化成在调度DAG中寻找一条优化路径,大大降低了算法的时间复杂度.并应用算法构造了一个编译器后端,测试表明,该算法能够正确地生成目标代码,和传统的分步优化算法相比,减小了目标代码的空间尺寸,降低了寄存器溢出的几率.  相似文献   

11.
从面向对象技术角度出发,论述了面向对象的VHDL语言(OO-VHDL)及其设计实现方法。分析了OO-VHDL的特点,介绍了面向对象的VHDL翻译器,总结了采用OO-VHDL进行设计具有速度快、结构清晰、可扩充性强等优点。  相似文献   

12.
针对传统指针模型所带来的内存使用上的不便性,设计了新的引用计数指针模型,并给出了引用使用规则.设计了通用的指针模板类,最后给出了测试和结果分析,证明此方法可以解决内存的自动管理问题.  相似文献   

13.
随钻测井技术相比传统测井能够获得更真实的地层数据信息,因而更适用于实际应用。但是,在随钻检测的过程中,需要迅速、精确地判断混合物中是否含有原油,即实现混合物的定性分析。激光拉曼光谱分析技术作为当前发展较为完整的分子光谱分析技术,被广泛应用到多种物质分析的领域中。针对原油钻井液混合物的特点,基于激光拉曼光谱分析技术,提出一种以偏最小二乘分析法为基础的定性分析算法,同时对已知获得的拉曼光谱进行平滑去噪、基线校正、归一化等预处理操作,并在此基础上完成以奇异值分解为主要方法的特征提取处理,进而实现对混合物定性分析的目的,并在一定的精度内完成定量计算。  相似文献   

14.
针对企业能源管理系统(EMS)开发过程中的问题,提出了一种基于BP神经网络的预测技术,并运用BP神经网络算法对某钢铁企业能源管理系统能源消费量进行建模与分析。将MATLAB算法工具箱和编译技术开发组件嵌入到系统中实现实时在线计算。结果显示算法达到了很好的预测效果。可以让企业能源管理者预先掌握企业能耗动态趋势,指导企业生产和调度,保障企业能源供需平衡。  相似文献   

15.
To reduce the complexity of lattice reduction aided (LRA) precoding, a low complexity LRA precoding based on the orthogonality defect threshold is proposed. We introduce the orthogonality defect (od) threshold as an early-termination condition into the lattice reduction (LR) algorithm which can reduce computational complexity by adaptively early terminating the LR processing. And, sorted QR decomposition of the channel matrix is used to enhance the probability of the early termination which further reduces computational complexity. Moreover, to achieve a favorable tradeoff between performance and complexity, we define a power loss factor (PLF) to optimize the od threshold. Simulation results show that the proposed algorithm can achieve significant complexity savings with nearly the same bit-error-rate (BER) performance as the traditional LRA precoding algorithm.  相似文献   

16.
17.
以图像噪声会影响下一步图像处理、分析及识别为启示,分析了常用的数字滤波算法优缺点,提出一种自适应阈值小波变换去噪方法.该方法根据含噪信号特性和信噪比,自适应地选择小波变换的最优分解层数和最佳软阂值,达到最优的降噪效果.仿真结果表明,这种算法在高斯噪声和椒盐噪声滤波能有效地滤除噪声,同时还能较好地保护图像细节,使图像达到更好的视觉效果.  相似文献   

18.
多入多出(MIMO)系统可以获得比单发单收系统更高的容量,对于MIMO系统,最大似然检测是最优接收,但其指数复杂度难以在实际中应用。针对该问题,结合格缩减理论提出了基于Householder变换的复数域格缩减算法,将该算法和MIMO次优检测算法相结合,给出了量化判决方法,且该复数域格缩减算法复杂度小于实数域格缩减算法。仿真结果表明,基于Householder变换复数域格缩减的MIMO次优检测算法,通过优化信道矩阵可以得到更好的判决域,取得了逼近最优最大似然检测算法的性能。  相似文献   

19.
基于Fuzzy-PID的电液位置伺服控制系统的FPGA设计与实现   总被引:2,自引:0,他引:2  
本文以电液位置伺服机械手第一关节为研究对象,设计了一种基于VHDL设计、FPGA实现的Fuzzy-PID控制器。分析了模糊(Fuzzy)自整定PID参数的模糊逻辑推理和控制器算法结构,根据自顶向下的流程,对Fuzzy-PID控制器进行了VHDL分层设计,详细说明了模糊逻辑推理、模糊自整定PID电路架构、数据缓存和I/O接口控制的设计原理,最后下载到FPGA芯片实现了Fuzzy-PID控制器。实验表明,FPGA作为单一控制器实现Fuzzy-PID控制算法是可行的和有效的。  相似文献   

20.
针对发电厂中指针式仪表数量多、周围环境复杂、灰尘污染等因素导致获得的图像含有大量噪声从而影响仪表读数识别精度的问题,提出了一种改进Canny边缘检测算法,通过采用5×5邻域计算像素梯度幅值的方法,提高了边缘检测精度,并采用自适应双阈值选择法,有效避免了传统Canny算法易出现伪边缘、边缘信息多等现象,结合Hough变换技术提取仪表指针信息,提高仪表识别精度。经实验对比验证,该算法检测效果优于传统Canny算法,仪表读数识别精度达到95%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号