首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 192 毫秒
1.
针对PC无法实时按位转置大量图像数据而限制了数码印花机输出带宽和喷印速度的问题,设计了基于PowerPC处理器和Virtex-5系列FPGA的高速数据处理系统,运用FPGA实现了高效转置运算。为FPGA例化三个独立的DDR2控制器,通过控制器间的协同工作提高系统输出带宽;设计按位转置单元,将图像数据分块转置,利用DDR2控制器的突发传输高效地读写数据。性能测试结果表明FPGA的输出带宽高达327 Mb/s,数码印花机的喷印速度达249 m2/h,相比PC处理系统,在同等条件下性能提升明显。  相似文献   

2.
针对当前基于ARM和DSP的嵌入式图像处理系统前端采集速度慢和图像处理算法不易加速的缺点,设计了一种基于HDMI接口的全高清(分辨率1920×1080)实时视频采集与图像处理系统;采用500万像素级别CMOS摄像头作为前端数据源,主芯片内部采用ARM+FPGA的异构架构,兼备FPGA的并行处理能力与ARM处理器任务调度功能;基于AXI协议设计了自定义数据存储传输的IP核,实现了处理速度与带宽最大化;利用HLS工具将图像预处理算法快速打包生成IP核,在FPGA中实现图像算法的硬件加速,完成图像处理系统平台原型机的设计;与传统的PC机和相机的机器视觉平台相比,该系统运行平均耗时在10 ms以内,实时检测效果令人满意,有效解决了低功耗与高数据带宽和处理速度之间的矛盾,为后端结果分析和边缘加速提供了良好支持。  相似文献   

3.
实时SAR成像系统中矩阵转置的设计和实现   总被引:6,自引:0,他引:6  
矩阵转置是多维图像和信号处理中常用的处理过程,在SAR成像系统中也有非常重要的应用,重点讨论了数据流处理中行进列出的一类转置问题,结合SAR成像算法,分析成像系统中矩阵转置的特点,提出了输入输出平衡的数据流转置方式,解决由于硬件实现中存储器读写速度不同和输入输出数据量不同所带来的输入输出负载不平衡问题,还介绍了SAR成像系统中转置存储部件的实现问题,转置存储部件采用双总线的结构,图像数据的输入和输出可以并行进行,具有非常高的数据传输速度,在66MHz的工作频率下,能达到340MB/s的数据吞吐率。  相似文献   

4.
针对目前对图像采集处理系统的高速性和便携性的要求,设计了一套基于DSP、FPGA和ARM9的实时图像采集处理系统.该系统主要利用FPGA的SoPC系统定制NiosⅡ软核处理器及相关外设IP核来完成图像数据的采集和存储.DSP通过EMIF接口和EDMA接口完成数据的搬移和图像处理的算法.ARM作为主机,通过HPI接口与DSP进行数据通信.结果表明,该平台工作性能稳定,处理能力强,能完成算法的数据处理并对数据实时显示,适用于自动循迹、模式识别等高速数据采集的应用场合.  相似文献   

5.
基于软硬件的协同支持在众核上对1-DFFT算法的优化研究   总被引:2,自引:0,他引:2  
随着高性能计算需求的日益增加,片上众核(many-core)处理器成为未来处理器架构的发展方向.快速傅立叶变换(FFT)作为高性能计算中的重要应用,对计算能力和通信带宽都有较高的要求.因此基于众核处理器平台,实现高效、可扩展的FFT算法是算法和体系结构设计者共同面临的挑战.文中在众核处理器Godson-T平台上对1-D FFT算法进行了优化和评估,在节省几乎三分之一L2 Cache存储开销的情况下,通过隐藏矩阵转置,计算与通信重叠等优化策略,使得优化后的1-D FFT算法达到3倍以上的性能提升.并通过片上网络拥塞状况的实验分析,发现对于像FFT这样访存带宽受限的应用,增加L2 Cache的访问带宽,可以缓解因为爆发式读写带给片上网络和L2 Cache的压力,进一步提高程序的性能和扩展性.  相似文献   

6.
潘青松  张怡  杨宗明  秦剑秀 《计算机科学》2017,44(Z11):530-533, 556
以Zynq芯片为基础,采用软硬件协同设计的方法设计并实现整个系统。Zynq芯片内部采用ARM+FPGA的异构架构,既具备ARM处理器的灵活性,又拥有FPGA并行处理的能力。本系统的设计充分发挥了Zynq芯片的优势,在软硬件划分上, 通过ARM处理器来实现图像的采集;图像角点及边缘检测用FPGA来完成,即通过硬件加速提升系统的整体性能。ARM处理器与FPGA通过AXI4总线进行数据交互,在Zynq上实现集图像采集、图像特征提取、图像显示为一体的片上系统。最终系统测试结果表明,采用硬件加速实现图像特征提取的相关算法比在ARM处理器软件上实现的算法的速度提高了6~8倍。  相似文献   

7.
为实现运动图像的实时压解传输,在优化二维DCT算法的基础上,采用流水线型自分块结构以及系数转换、矩阵转置、数据装载和截位的通盘解决方式,构造了一个流水线型自分块的二维DCT硬件核,以实现运动图像的实时压缩。  相似文献   

8.
随着嵌入式系统软、硬件的快速发展和通信带宽的拓展,网络图像传输将广泛应用于各领域。基于硬压缩的网络图像传输装置是以S3C4510B微处理器和MV3018芯片为核心的嵌入式网络图像传输系统。通过图像采集模块OV7660获取图像信号后,由MV3018完成图像的JPEG或MJPEG的压缩功能,实现图像的硬件编码,最后通过芯片RTL8201完成与互联网的接口。嵌入式处理器S3C4510B运行μClinux操作系统,实现了图像数据的采集、压缩和网络传输。实验证明,该系统可作为网络图像传输系统的平台。  相似文献   

9.
介绍一种基于FPGA的高清图像处理系统。该系统以NOISⅡ软核处理器为主控制器,采用IP核模块的设计方法,运用快速中值滤波算法对图像进行处理。给出算法的FPGA硬件实现和时序仿真图。实验结果表明,该系统能够稳定地用在各个高清图像的处理环境中。  相似文献   

10.
针对大场景视频拼接技术在汽车环视系统等领域的应用需求,并为了适应嵌入式系统快速发展的要求,提出了基于FPGA片上可编程系统(system on a programmable chip,SOPC)技术来实现多个摄像头视频数据的传输和拼接的大视场视频解决方案.系统的硬件平台的构建以Xilinx软核处理器Microblaze为核心,主要完成了视频数据的采集、存储、处理以及传输等工作,图像拼接部分采用频域相位相关算法,对待拼接图像进行配准,并通过融合算法得到具有360°全景视频信息的大视场图像.通过实验对系统进行测试,验证了系统的可行性.  相似文献   

11.
随着图像匹配的应用越来越广泛,图像匹配的实时性要求也越来越高。为了提高图像匹配的速度和更好地利用多核计算资源,设计了一种基于Hausdorff距离的图像匹配并行算法。首先介绍了Hausdorff距离的定义,然后分析了图像匹配串行算法的效率,在此基础上设计了基于Hausdorff距离的图像匹配并行算法,最后采用Matlab在多核计算机上对并行算法进行了实现。实验结果表明,文中所设计的并行算法能够显著提高图像匹配速度,并具有较好的抗失真和抗噪声性能。文中设计的并行算法有较好的扩展性,可以将这种并行思想应用到其它图像匹配算法的并行设计中。  相似文献   

12.
随着星载遥感技术的不断发展,产生的遥感数据也变得日渐庞大,目前有限的通信带宽远不能满足遥感图像数据传输的需求。因此研究面向星载应用的图像压缩技术对空间应用技术的发展有着十分重要的意义。采用传统单核数字信号处理器(DSP)难以满足性能需求,而采用现场可编程门阵列(FPGA)则难以满足功耗需求,近年来随着硬件技术发展,多核DSP技术已经成熟,且在弹载场景已有比较成熟的多核DSP图像压缩解决方案,可供星载应用参考。基于多核DSP,即TI公司的C6678多核浮点DSP平台,构建一个并行图像压缩系统,并充分利用多核DSP的硬件资源。考虑星载遥感图像压缩对压缩质量、压缩速度等多方面指标都有着较高的要求,系统采用JPEG2000标准进行图像压缩,并且采用了主核负责外部通信与内部任务分配、从核执行JPEG2000图像压缩的设计方案。测试结果表明,该系统运行稳定可靠,且整体压缩性能优秀,能够满足对星载遥感图像压缩系统的性能要求。  相似文献   

13.
快速傅里叶变换(fast Fourier transform, FFT)是数字信号处理(digital signal processing, DSP)领域中最耗时的核心算法,该算法的计算性能和计算效率将影响整个应用的执行效率.因此,在DSP芯片上设计实现了一个基于矩阵转置操作的高能效可变长度FFT加速器,采用多种并行策略开发批量小规模FFT算法与大规模Cooley-Tukey FFT算法中指令级和任务级并行.设计“乒乓”多体数据存储器,重叠数据搬移和FFT计算之间的开销,提高FFT加速器计算效率.并基于此存储器,提出基于基本块的快速矩阵转置算法,从而避免对数据矩阵的列访问;提出混合旋转因子产生策略,结合查表和基于CORDIC算法在线计算方式,最大限度降低旋转因子产生的硬件开销.实验结果表明:FFT加速器原型的峰值能效为146 GFLOPs/W,相比Intel Xeon CPU上的多线程FFTW实现,取得2个数量级的能效提升.  相似文献   

14.
印花行业中的半色调技术来源于印刷行业,众所周知,彩色印刷中的半色调技术主要采用调幅和调频两种方法,但是由于印花行业与印刷行业具体工艺的不同,两者的半色调技术存在许多不同的特点,而彩色印刷中的半色调方法并不能直接应用于印花行业,因此需要研究适合印花行业的半色调方法。针对印花行业的特点,本文提出了一种全新的挂网算法,该算法不仅能够满足印花行业特定工艺的需要,而且从根本上解决了印制云纹图案时容易产生龟纹  相似文献   

15.
针对现有海量数字图像信息落后,提出了新型的压缩算法,设计出基于FPGA的视频图像采集系统.应用深度卷积神经网络优化视频图像编码算法和聚类算法实现数据特征提取,将图像与距离信息作为深度卷积神经网络的输入与输出,并利用其特征提取能力学习图像特征的距离信息,提取深度卷积神经网络中的全连接层作为编码,通过迭代调整确定图像编码,完成图像压缩.应用测试结果显示,该算法具有较高效率优势,且图像压缩解码后质量较好.  相似文献   

16.
基于混沌序列和分组密码的数字图像置乱技术   总被引:1,自引:0,他引:1  
给出了一种全新的数字图像置乱方案,其中混沌序列用于给出分组密码算法的初始密钥,分组密码采用以换位变换为核心的ZF-02分组密码算法.该算法的优点是能够很好地抵抗线性、差分等多种攻击,又易于软、硬件实现.  相似文献   

17.
三角剖分过程是影响三维重建系统实时性的瓶颈之一,为提高三角剖分速度,基于共享内存多核计算机设计并实现了并行Delaunay算法。该算法在分治三角剖分算法的基础上,通过改进子三角网归并过程及Delaunay三角网优化过程避免了并行计算中的数据竞争问题。利用月面仿真实验场真实地形数据在50万到500万不同规模的点云数据集上进行了实验,加速比最高可达6.44。除此之外,对算法复杂度、加速比以及并行效率进行了全面分析,并将算法实际应用于月面地形重构系统,实现了虚拟地形的快速构建。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号