首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
陈曈  杨东勇  石洗凡 《计算机工程》2011,37(1):285-286,289
全方位图像展开算法运算量大,在当前的主流处理器中难以满足实时要求,对其仅做简单并行处理效果仍不理想。针对此问题,基于多核处理器改进双线性内插值法的全方位图像展开算法,对其实现并行处理。通过全方位图像展开实验,对展开时间、并行效率、渲染速度等进行分析和比较。实验结果表明,并行优化后,在E7200(双核2.53 GHz)下实时处理的分辨率能从640×480提高到1 024×768。  相似文献   

2.
为提高目前硬件运行卷积神经网络(CNN)的速度和能效,针对主流CNN网络的卷积计算设计加速模块并在FPGA上实现用于加速CNN网络的SoC系统。硬件平台采用带有ARM处理器的ZCU102 FPGA开发板,系统采用处理器和加速器的结构进行设计。加速器负责卷积计算,采用分块技术并重组卷积计算循环次序,使片上缓存的数据复用率更高,减少系统与内存之间数据的传输。支持1×1到11×11的卷积核尺寸,硬件支持的激活函数为ReLU和Leaky ReLU。处理器负责控制并处理CNN网络的其它计算,使SoC系统具有通用性和灵活性。实验结果表明,在100 MHz的工作频率下,峰值计算性能可以达到42.13 GFLOPS,相比CPU和其它FPGA计算的性能有一定提升。  相似文献   

3.
为了提高基于VPX的抗恶劣环境计算机的处理能力,提出了一种基于双核PowerPC处理器的计算模块的设计方法;该方法中包括了基于双核PowerPC处理器的计算模块的主要设计思路和实现过程;在该方法通过采用双核PowerPC处理器提高了计算机性能,采用仿真手段保证了模块高速接口电路设计的信号完整性,采用FPGA实现了模块高速接口的扩展,并使模块接口具备可配置的能力;该方法应经投入应用,在应用过程中取得了良好的效果。  相似文献   

4.
转炉火焰图像边缘弯曲程度能表征炉内铁水碳含量的多少,准确计算曲线弯曲度,对火焰图像判断转炉吹炼终点有重要的意义。提出一种基于差分链码曲率的边界弯曲度计算方法,定义了基于差分链码的火焰边界曲率计算公式;为了保证曲率公式的有效性,对火焰原始图像作分割、标记、二值化、形态学边界提取等预处理;利用多边形近似方法重建了火焰边界的二值图像,有效克服了边界小尺度拐角对曲率公式的影响。实验结果表明,该方法与边界圆形度及火焰骨架曲率计算的方法相比,所提取出的特征值能明显区分吹炼的不同阶段,且计算速度快,具有较高的实用价值。  相似文献   

5.
一种新的基于HIS和小波变换的图像融合方法*   总被引:2,自引:1,他引:1  
针对遥感图像影像分辨率低的问题,提出了一种新的基于HIS和小波变换的低分辨多光谱和高分辨全色图像的融合方法.该方法通过对高分辨全色图像小波分解后的低频分量进行低通滤波,将全色图像的低频信息中的高频分量融入到多光谱图像HIS空间的亮度信息的低频中;再将这个融合后的低频和高分辨全色图像的细节信息进行小波反变换,得到融合后的图像.该图像很大程度地保留了多光谱的光谱特性和高分辨图像的空间分辨率.仿真结果表明了本方法的有效性.  相似文献   

6.
TMS320C30是第三代数字信号处理器,指令周期60-ns,支持浮点运算,已在实时数字信号处理中得到了广泛的应用。本文讨论在实际应用中常要涉及的一些典型函数在TMS320C30上的计算方法。文中首先简要介绍了TMS320C30的特点,分析归纳了典型函数近似计算的常用方法,即多项式近似计算方法和迭代计算方法。在此基础上,以正弦函数为例介绍了TMS320C30上多项式近似计算的实现过程;以倒数和开平方运算为例,介绍了迭代近似方法,推导出了各自的迭代公式,给出了迭代初始值x[0]的选取办法。最后简要介绍了实验环境,给出了典型函数在TMS320C30上的执行时间。  相似文献   

7.
Schraudolph proposed an excellent exponential approximation providing increased performance particularly suited to the logistic squashing function used within many neural networking applications. This note applies Intel's streaming SIMD Extensions 2 (SSE2), where SIMD is single instruction multiple data, of the Pentium IV class processor to Schraudolph's technique, further increasing the performance of the logistic squashing function. It was found that the calculation of the new 32-bit SSE2 logistic squashing function described here was up to 38 times faster than the conventional exponential function and up to 16 times faster than a Schraudolph-style 32-bit method on an Intel Pentium D 3.6 GHz CPU.  相似文献   

8.
提出了一种表面不规则裂纹特征的检测方法,通过获取CCD相机拍照得到裂纹图像,使用MATLAB图像处理工具箱对图像进行灰度化、二值化处理。对二值图像可以进行细化处理以求得裂纹长度,提取灰度等值线可以获得裂纹边界,在提出的修正算法下可以得到裂纹真实宽度的近似值,相比于其他已知方法提高了计算结果的精度,并且实现了自动处理,降低了数据处理过程中的人工劳动强度,提高了数据处理效率。  相似文献   

9.
为了提高高级加密标准(AES)算法在ARM上的执行效率,针对明文长度和密钥长度均为128位的AES算法,提出了一种在ARM上高效运行并且占用较少ROM空间的实现方案。S盒采用即时计算的方法生成,将列混合和逆列混合修改为针对32位字的操作,密钥扩展采用即时密钥扩展。在S3C2440处理器上实现的实验结果表明,AES算法的优化方案可以在ARM处理器上高效运行并占用了较少的ROM空间。该方案可以应用于存储空间较小的嵌入式系统中。  相似文献   

10.
陈树越  徐来  吴玮婕 《测控技术》2016,35(12):45-48
随着安检要求的日益提高,计算机断层扫描的安检方式正成为X光安检中越来越重要的部分.为了保证行李扫描的检测效率,加快断层扫描图像的迭代计算速度,提出了一种采用小波变换域取代图像空间来测算图像小波系数的估值方法.该方法以交替最小化算法为框架,在逼近系数时,创建一个替代函数,随着迭代次数的增加,基于同一标准的小波树得以更新扩展,每层的细节系数均更新,小波树也依此扩展,以此达到加速迭代的效果.实验结果表明,该方法比原交替最小化算法最大能减少66.7%的迭代运算次数.  相似文献   

11.
We consider Chebyshev pseudospectral methods for the study of atmospheric wave phenomena. The governing equations are the two-dimensional Euler equations for gas dynamics with gravity included, where accurate numerical approximation of the nonlinear behaviour is important. The methods are efficiently implemented on a Cray X-MP, and run at nearly optimal speed on one processor. In this case, space derivatives are calculated more efficiently with matrix multiplication than by the Fast Fourier Transform. The boundaries are artificial and we simulate open boundaries by using the characteristic variables of the equations. Different choices of such boundary conditions and their effects on the solutions are discussed. Numerical calculation of an example where the solution may be analytically verified is presented, and the pseudospectral method is seen to be well suited for these computations.  相似文献   

12.
This paper proposed the real-time tracking algorithm in the active camera system, which is based on the intelligent method. To separate the object from background, the similarity of the color is analyzed through the fuzzy inference engine. And after segmentation, the local difference method between the continuous images is used to track the moving object. The experiment is performed using the developed embedded camera system with an ARM processor. This work was presented in part at the 13th International Symposium on Artificial Life and Robotics, Oita, Japan, January 31–February 2, 2008  相似文献   

13.
依据大气散射的物理原理,提出了一种考虑多重散射的天空光照效果建 模与实时绘制方法。该方法首先以太阳和天空光作为光源建立了多重散射的天空光照效果模 型,然后综合多种大气粒子密度, 采用合理的分段采样策略,对天空颜色模型的积分进行简 化,以减少积分近似计算所带来的误差;通过对简化后的模型进行分析提出了采用二维纹理 与三维纹理对光学深度预计算的方法,避免了运行时计算光学深度积分的问题;最后该算法 在GPU 的片段处理器上执行,实现了天空光照效果模型的实时绘制,可以满足各种实时应 用需求。  相似文献   

14.
模板计算是一类重要的计算核心,广泛存在于图像和视频处理以及大规模科学和工程计算领域。但是,针对ARM64高性能处理器的模板计算性能的优化研究还很少。为了实现典型模板计算核心在ARM64架构多核微处理器上的并行化和性能优化,基于AMCC X-GENE2和飞腾FT-1500A多核微处理器特点,提出了基于两维度绑定的优化方法,该方法通过线程与CPU绑定以及线程与数据块绑定,减少了线程调度的并行开销,增加了Cache的命中率。实验结果表明,该方法提升了模板计算在ARM64架构多核微处理器上的性能,且在两种ARM64架构多核微处理器平台上都表现出较好的可扩展性。  相似文献   

15.
基于FPGA的核电站仪控设备中涉及大量浮点指数运算,而常用的CORDIC算法和线性逼近法等存在计算范围小、计算精度不高等问题,对FPGA硬件实现指数函数的方法进行研究,并提出一种改进的级数近似法;该方法对输入进行预处理,将输入分解后采用查找表和泰勒级数展开结合的方法,在展开很少项数的情况下快速收敛,发挥查找表法和级数近似法的优势,提高算法的运算精度和效率;在Matlab环境下对改进算法的有效性进行仿真验证,且采用Verilog语言进行编程实现,在Microsemi公司的IGLOO2系列FPGA上进行具体算法性能验证;Matlab仿真和FPGA验证结果均表明,改进的级数近似法能够大幅增大指数函数的自变量输入范围,并提高计算精度。  相似文献   

16.
基于流处理器的图像灰度变换并行处理研究   总被引:1,自引:0,他引:1  
提出了一种基于流处理器的图像灰度变换并行处理系统.该系统采用Strom-1 系列SP16HP-G220流数字信号处理器构建硬件平台,根据流处理器体系结构特点建立了适应图像灰度变换并行处理的流程序模型,并对图像灰度变换进行算法并行性分析与算法流化.对利用流化过的算法与传统灰度变换算法进行了对比实验.实验结果表明,灰度变换...  相似文献   

17.
In the sort-last-sparse parallel volume rendering system on distributed memory multicomputers, one can achieve a very good performance improvement in the rendering phase by increasing the number of processors. This is because each processor can render images locally without communicating with other processors. However, in the compositing phase, a processor has to exchange local images with other processors. When the number of processors exceeds a threshold, the image compositing time becomes a bottleneck. In this paper, we propose three compositing methods to efficiently reduce the compositing time in parallel volume rendering. They are the binary-swap with bounding rectangle (BSBR) method, the binary-swap with run-length encoding and static load-balancing (BSLC) method, and the binary-swap with bounding rectangle and run-length encoding (BSBRC) method. The proposed methods were implemented on an SP2 parallel machine along with the binary-swap compositing method. The experimental results show that the BSBRC method has the best performance among these four methods.  相似文献   

18.
闭环连续系统仿真若干问题的分析研究   总被引:1,自引:0,他引:1  
分析研究了对闭环系统的纯滞后环节如何处理的问题,找到开环系统和闭环系统的理论输出值计算方法,并比较3种Pade近似和全极点近似的精度。将此算法应用到闭环系统中,进一步比较4种近似,以求得闭环系统中误差最小的近似方法。同时提出在计算过程中对纯滞后处理的改进方法,使得误差大大减小,精度提高了一个数量级。研究结果表明,在开环系统和闭环系统,全极点近似由于没有引入零点,使得误差最小;改进方法使误差精度提高了一个数量级。  相似文献   

19.
The implementation of a Hough transform processor using a wafer-scale-integration technology, restructurable VLSI circuit is described. The Hough transform is typically used as a grouping operation in an image processing sequence. The transform discussed here groups pixels in order to extract linear features. This calculation is realized with a wafer-scale processor that allows a complete line extraction system to be integrated on a single PC board. Also discussed is the use of the CAD tools that allowed this processor to be realized without incurring silicon layout and processing overhead  相似文献   

20.
黄仁泰 《计算机应用》2007,27(9):2154-2156
为了降低多边形区域上矩计算的复杂度和减少楔波近似的运算时间,提出了一种楔波近似快速新算法。采用任意局部退化模型代替局部恒定退化模型,对比实验结果表明:新算法与现有文献的算法相比,运算速度提高了3个数量级;适用于不同参数的模型,灵活性得到较大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号