首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
动态二进制翻译是跨平台软件移植的最重要手段之一,如何对其进行优化,提高翻译效率一直是研究的热点。文章对I386到Alpha平台的动态二进制翻译进行了研究,提出了一种较好的翻译缓存管理策略,在FIFO的基础上将翻译缓存划分为两级进行管理。以QEMU动态二进制翻译器为实验平台进行测试,结果表明,采用此方法可以提升翻译速度约3%。  相似文献   

2.
近年来,GPU的快速发展与NVIDIA公司推出的CUDA技术,推动着GPU在高性能计算领域中的应用。研究并实现CUDA程序性能分析工具,对充分利用GPU的计算优势和提高CUDA架构下并行程序的执行性能具有重要的意义。该文分析了GPU硬件平台的特点和CUDA并行编程模型,结合CPU集群环境下并行程序的性能分析,设计并实现了一种基于指导语句的CUDA程序性能分析工具,并实验验证了其在不同GPU硬件平台上的有效性。  相似文献   

3.
4.
针对传统RANSAC的许多局限性--样本多、模型复杂或数据错误率高时计算效率低,模型检验精度与数据错误率不易合理设置,无法批处理同模型不同样本集,提出一种基于CUDA的RANSAC并行改良,在保证计算结果置信概率与传统RANSAC一致的前提下,同时对抽样、解模型及检验模型并行同步处理,最终选择出符合要求的最优模型参数.以NVIDIA GPU支持的CUDA为并行计算环境,挖掘其硬件架构的通用计算特性,设计并实现了RANSAC的高效GPU运算模式.实验表明,改良后的算法能够克服传统RANSAC的诸多局限性,且保留了其简单易用的特点.  相似文献   

5.
为了实现对桩基多处缺陷的探测和提高缺陷类型检测的正确率,依据模式识别理论和小波理论,采用局部特征分析的方法,改进现有特征向量提取方式,提出了特征向量的移动视窗提取方法及特征向量的矩阵形式.与现有方法相比,特征向量的视窗提取方法可以检测出同一桩基存在的两个以上缺陷点,能更准确检测各个缺陷的位置,并大幅提高了依据桩基反射波对桩基缺陷类型检测的正确率.该方法适合于基于反射波的多目标探测和一维构件的多缺陷检测等相关领域研究.  相似文献   

6.
二进制翻译中本地代码替换是实现消息传递接口(Message Passing Interface,MPI)并行程序跨架构移植的重要手段。通过调用本地代码实现库函数功能,本地代码替换技术保证功能的等价模拟。然而,现有的本地代码替换方法无法识别基于跳转指令实现的函数调用,导致MPI程序翻译运行出错。针对这一问题,提出一种基于地址重用的本地代码替换方法,通过向客户程序中目标函数的地址空间嵌入编码信息,将翻译系统控制流重定向至本地代码替换流程。实验结果表明,该方法能够正确处理基于跳转指令实现的函数调用,且相比于已有方法引入的运行时开销更低。  相似文献   

7.
在传统视频关键帧提取过程中,需要对每一帧视频图像进行特征提取、图像匹配、重复检测等大量计算,导致算法运行时间过长。对此,该文提出了CUDA框架下的关键帧互信息熵多级提取算法。在CPU调度及GPU划分线程基础上,依据帧间三通道互信息熵,将视频序列初次划分为静态片段类和动态片段类;运用相邻帧间互信息量极小值法,将动态片段划分成多个关键子类,在关键子类中选取预备关键帧;并运用SUSAN算子分块计算,快速完成帧间的边缘匹配,从预备关键帧中滤除冗余,得到最终的关键帧序列。实验结果表明,与其他算法相比,该算法的查全率和查准率均为91%以上,提取关键帧的数量平均减少约42.82%,降低了视频数据量的存储,与其他CPU串行方法相比,其关键帧提取时间减少约50%,提高了算法运算效率。  相似文献   

8.
基于CUDA的细分曲面阴影体算法   总被引:1,自引:0,他引:1  
为了在虚拟现实、电脑游戏等图形应用中更快速生成和实时绘制细分曲面的阴影,提出采用CUDA架构的GPU阴影体生成算法.该算法采用基于CUDA的曲面细分算法,通过CUDA共享内存结构使表面细分过程更加高效.采用基于CUDA的阴影体算法产生阴影轮廓线以及拉伸出阴影体.通过基于CUDA的流式缩减算法对阴影体数组进行压缩.通过优化CUDA和OpenGL的互操作,将绘制过程从以往算法的3步减少为2步.该算法在具有CUDA硬件的标准PC上进行测试.实验结果表明,与之前的GPU的算法相比,该算法可以生成更复杂细分曲面的阴影体,阴影体数组占用显存空间降低到2%以下,并可获得高达4倍的绘制速度提升.  相似文献   

9.
使用CUDA(compute unified device architecture,统一计算架构),利用GPU(graphic processing unit,图像处理器)强大的并行能力实现DEM(discrete element method,离散单元法)的离散粒子系统模拟仿真。邻域搜索时使用基于哈希表排序的邻域搜索算法,依据CUDA内存模型的特点对系统做出有效的内存规划,并使用CUDA流技术通过将粒子碰撞和数据输出分割成4个流异步执行,来隐藏数据拷贝的部分延迟。通过使用CUDA的事件作为GPU计时器监测,实验证明本文中的并行搜索算法的执行效率很高,而使用合理的内存策略和流技术也可以有效的提高系统盼性能。  相似文献   

10.
动态二进制翻译是跨平台软件移植的最重要手段之一,如何对其进行优化,提高翻译效率一直是研究的热点。文章对I386到Alpha平台的动态二进制翻译进行了研究,提出了一种较好的翻译缓存管理策略,在FIFO的基础上将翻译缓存划分为两级进行管理。以QEMU动态二进制翻译器为实验平台进行测试,结果表明,采用此方法可以提升翻译速度约3%。  相似文献   

11.
现代CPU拥有强大的计算能力.文中提出了利用GPU解决高性能计算的问题,包括GPU编程的方法、高性能计算问题的划分原则等.实验表明,CPU高性能计算相比多核CPU具有更高的效率.  相似文献   

12.
一类循环分块阵特征向量的求法   总被引:3,自引:0,他引:3  
本文给出一类循环分块阵的特征向量的求法及证明。  相似文献   

13.
介绍了层次分析法(AHP)中计算排序权值的梯度特征向量法,提出了矩阵不完全一致时权值计算的方法,得到好的结果.  相似文献   

14.
对于一个n阶模糊矩阵A,可以给出它的模糊特征向量。若给定一个n维模糊向量r,存在一个n阶模糊矩阵A,使得r正好是A的模糊特征向量。讨论了矩阵A的元素aij的元素ri之间的关系。  相似文献   

15.
提出一种新的、基于支持向量回归(SVR)的音频水印提取方法.在该方法中,利用子采样技术将原始音频信号划分为四个子音频信号.这些子音频对应的DCT系数间具有高的相关性,将这种相关性视为一种回归问题.在水印提取过程中,利用支持向量回归来学习这种相关性,并使用训练好的SVR完成水印的提取.实验结果表明该方法对比其它几种方法有良好的性能和更好的鲁棒性.  相似文献   

16.
针对传统的基于支持向量机的文本分类存在的问题进行了研究,采用二叉树结构与多个支持向量机子分类器组合进行Web文本信息分类,在二叉树支持向量机多类方法的基础上,进一步结合遗传算法,提出了一种新的支持向量机的多类分类方法,实验结果表明,采用该方法进行多类分类,分类精度明显提高,体现了将遗传算法与二叉树支持向量机结合的优越性。  相似文献   

17.
针对数控磨床磨削加工过程中的颤振现象,提出一种基于希尔伯特黄变换的磨削颤振特征量提取方法。采用经验模式分解,将信号分解成具有不同特征时间尺度的固有模态函数分量,筛选合适的分量,提取其颤振特征量实时方差和瞬时能量,并将其作为判断磨削发生颤振的依据。模拟仿真结果表明:基于希尔伯特一黄变换提取的磨削颤振特征量,可以作为颤振发生的判断依据。  相似文献   

18.
探讨了相关向量机的分类原理及其在物体识别中的应用,其核函数无需满足mercer条件,且不需要误差参数的实验调整.提出了一种基于物体显著区域的特征描述方法,在有效提取物体特征的同时,大大减少了描述物体的特征量.实验结果表明,相关向量机不仅具有与支持向量机相同的性能,而且其相关向量较少,并取得了较好的识别效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号