排序方式: 共有74条查询结果,搜索用时 15 毫秒
21.
针对基于FPGA的嵌入式系统中软件网络协议栈需要内置CPU的不足,阐述了采用全硬件方式实现网络协议栈的必要性,并提出了适合的网络通信协议栈裁剪方案.该协议栈包含精简的UDP、IP、以及MAC层驱动,可完成常规的网络通信.协议栈完全采用硬件描述语言编写,并在FPGA中实现.实验结果表明,该协议栈只占用2K逻辑资源,能以100Mbps的速率在FPGA与PC之间进行数据传输,为基于FPGA的系统调试及运行提供了一种简易的高速通信手段. 相似文献
22.
实际应用中对目标跟踪的实时性要求越来越高。针对这个问题,设计并实现一种基于FPGA的Mean Shift跟踪系统。针对FPGA硬件平台的浮点运算复杂度高的特点,对核函数和权重计算进行优化,使用定点运算替代浮点运算。在处理同样分辨率的视频/图像数据时,与通用CPU E7400相比,该系统可使得性能有很大的提升。采用此方法大大提高了Mean Shift跟踪算法的计算速度,满足实时性的要求。 相似文献
23.
特征提取与描述是众多计算机视觉应用的基础。局部特征提取与描述因像素级处理产生的高维计算而导致其计算复杂、实时性差,影响了算法在实际系统中的应用。研究了局部特征提取与描述中的关键共性计算模块——图像金字塔机制及图像梯度计算。基于NVIDIA GPU/CUDA架构设计并实现了共性模块的并行计算,并通过优化全局存储、纹理存储及共享存储的访问方式进一步实现了其高效计算。实验结果表明,基于GPU的图像金字塔和图像梯度计算比CPU获得了30倍左右的加速,将实现的图像金字塔和图像梯度计算应用于HOG特征提取与描述算法,相比CPU获得了40倍左右的加速。该研究对于基于GPU实现局部特征的高速提取与描述具有现实意义。 相似文献
24.
在数字货币、区块链、云端数据加密等领域,传统以软件方式运行的数据加解密存在计算速度慢、占用主机资源、功耗高等问题,而以Verilog/VHDL等方式实现的现场可编程门阵列(FPGA)加解密系统又存在开发周期长、维护升级困难等问题。针对3DES算法,提出一种基于OpenCL的FPGA加速器设计方案。设计具有48轮迭代的流水并行结构,在数据传输模块中采用数据存储调整、数据位宽改进策略提高内核实际带宽利用率,在算法加密模块中采用指令流优化策略形成流水线并行架构,同时采用内核矢量化、计算单元复制策略进一步提高内核性能。实验结果表明,该加速器在Intel Stratix 10 GX2800上可获得111.801 Gb/s的吞吐率,与Intel Core i7-9700 CPU相比性能提升372倍,能效提升644倍,与NvidiaGeForce GTX 1080Ti GPU相比性能提升20%,能效提升9倍。 相似文献
25.
26.
27.
提出了一种基于FPGA的卷积运算IP核的设计方法.充分利用FPGA的并行体系架构和丰富的块存储资源采用规则的模块化的设计方法并兼顾可扩展的原则完成了二维图像卷积IP核的设计,实现了实时图像卷积运算中卷积窗口大小和卷积系数的灵活调整.这种新的卷积IP核在充分节约硬件资源的前提下很好地满足了实际的应用,使得卷积运算在图像处理应用中更加灵活方便. 相似文献
28.
光流法是计算机视觉中的一个基础性算法,可广泛应用于运动检测、运动估计、视频分析等领域。但高质量光流法最大的问题是计算复杂、速度慢,限制了它在实际系统中的应用。针对一种混合亮度和梯度模型的高质量光流法,为其设计了一种高效、可扩展的并行计算方法。通过在具有代表性的网络众核架构-Tilera上进行验证,对于分辨率为640×480的图片,提出的并行计算方法在具有36核的Tilera处理器上执行时间为0.80秒,比主频3.40 GHz的CPU i3-3240快2.56倍,但功耗不到其1/6。当用于嵌入式环境时,其速度比ARM9处理器快33倍,而功耗只有它的一半。实验表明该并行算法具有良好的扩展性,可通过选择不同核数的处理器满足系统对性能、功耗的综合需求。 相似文献
29.
基于数字图像处理的拼毛比例分析 总被引:1,自引:1,他引:0
为解决毛纺企业拼毛工序中存在的经验性、耗时性问题,提出采用FCM算法统计拼毛毛条中各颜色纤维的比例,以提高拼毛效率。在利用扫描仪完成图像采集的基础上,首先将图像由RGB模式转换为均匀色彩空间L*a*b*模式,然后利用FCM算法对图像中的所有像素进行聚类分析,再对分类结果作统计分析得出各种颜色像素所占百分比,进而得出拼毛比例。另就图像扫描分辨率和扫描区域大小对测试结果的影响进行探讨。结果表明,采集图像其扫描分辨率在不低于3 000 dpi、扫描区域不小于40 mm×40 mm时,分析所得各颜色像素点的百分比才比较稳定,接近实际值。 相似文献
30.