首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 82 毫秒
1.
矩阵乘法是很多应用问题的核心计算模块,在OpenSPARC T2处理器平台上,对矩阵乘法算法进行了设计优化,针对矩阵乘法访存特点,利用处理器本身8核64线程的特征,基于Open MP并行编程模型设计了矩阵乘多线程并行算法,并对访存和块大小进行了优化,采用C语言编程,对比单核单线程,并行矩阵乘算法在8核64线程的加速比达到21.9%,发挥峰值性能的53.9%。  相似文献   

2.
何岳 《信息通信》2014,(9):95-97
针对小规模应用软件对大信息量数据库的访问普遍存在的效率过低、耗时过长的问题,从多任务的思想出发,以多线程技术为中心,其他技术为辅助,提出了一套简单易行的高效率的大数据库访问解决方案。对当前大多数小规模数据库应用软件开发有着重要的实际意义。  相似文献   

3.
杨秋虎 《电子科技》2015,28(3):19-21,37
LabWindows/CVI多线程技术可保证并发任务的顺利执行。多线程技术解决了并发任务之间的冲突问题,能大幅提高工作效率。针对多个线程之间数据共享与传递,提供了良好的数据保护机制。文中对数据保护的机制与具体实现方法进行了阐述,结合多线程技术完成了仪器自动控制界面开发,试验证明,多线程技术的优势在并发任务系统中得到良好的体现。  相似文献   

4.
伴随着计算机硬件以及软件的快速发展,多核心的CPU正在快速普及到各个部门,当前撑血设计和软件开发的热门问题是电脑上的并行计算。并行计算的出现对传统的串行计算是一个巨大的改变,现在multi-core(多核)以及multi-threading(多线程:特质硬件线程)处理器发展飞速,成为了外来研发技术和硬件设施的新领域。  相似文献   

5.
李立珺 《电子设计工程》2013,21(13):156-158,161
传统的复数乘法器实现需要4个乘法器和2个加法器。在现场可编程门阵列(FPGA)中乘法器资源是非常宝贵的,因此,给出了两种复数乘法的优化算法,一种方法可以节省25%的乘法器资源,另一种可以节省50%的乘法器资源,而且其实现架构可以使用流水线满足高速数字信号处理的要求。同时,还给出了数字信号处理中常用的有限冲激响应(FIR)滤波器和共轭复乘的优化实例。  相似文献   

6.
介绍了一种基于上芯机控制平台的多线程解释器技术.在分析了该通用平台的指令和性能需求的基础上,讨论了多线程解释器的功能和性能需求,然后在对解释器总体设计方面的研究中,分析了解释器的整体结构,分析了解释器相关的各项关键技术、词法分析、语法分析、解释执行,结合编译技术对基于上芯机控制平台的多线程解释器做了概要设计,进而提出了多线程解释的方案.详细介绍了这一方案的核心设计方法及其技术实现细节.  相似文献   

7.
根据各多线程技术和多核特点,提出了归并排序基于多线程的改进方法.并采用各排序算法组合的方法,使用WIN32 API多线程编程方法实现了新的算法.实验结果表明该算法比传统算法效率有很大提升.  相似文献   

8.
吴蓬勃 《电子技术》2014,(2):32-36,26
文章介绍了为探索国产多核处理器在军用电子系统上的应用,而采用国产龙芯3A多核处理器及相关桥芯片,配以VXWORKS操作系统和图像处理等软件进行的军用电子系统应用设计;该系统具有图像处理、串口、SATA、网口、USB等多种接口和PMC接口扩展等多种功能。能够通过USB接口输入视频图像,采用软件算法进行多核图像实时处理,VGA接口进行视频输出显示;为满足军用电子系统的综合化、集成化、小型化、低功耗和国产化等要求提供了设计参考。  相似文献   

9.
基于A*算法的多线程并行航迹规划方法研究   总被引:1,自引:2,他引:1  
并行计算是提高航迹规划速度的一种有效手段,同时A*算法具有隐含并行的特性,计算机多CPU多线程技术使得并行计算脱离了工作站或工作组计算机,可使A*算法在单机上进行并行计算。随后根据A*算法的特点对并行计算进行了相应改进,并将其应用到巡航导弹的航迹规划当中。仿真结果表明:改进的并行算法在没有改变航迹规划结果性能的同时,计算速度、稳定性都有了较大提高,有利于快速航迹规划。  相似文献   

10.
讨论在Fermi结构GPU使用CUDA对GEMM(单精度和双精度)算法进行优化,以及Fermi体系结构的新特性(如缓存)对性能的影响。GPU缓存一方面可以提高处理器在运行时数据访问的局部性,另一方面使得代码性能对与性能相关算法参数的依赖变得不可预测。自动优化技术可以用来解决这一问题。自动优化的SGEMM和DGEMM代码在Tesla C2050 GPU上达到了563GFlops和253GFlops的性能。代码使用CUDA和C语言进行实现,未进行二进制代码级别的优化。  相似文献   

11.
基于龙芯2F架构的PMON分析与优化   总被引:4,自引:0,他引:4  
基本输入/输出系统(BIOS)是现代计算机系统的重要组成部分,负责计算机系统的开机自检、板级初始化、加栽操作系统内核以及基本I/O功能。以龙芯2FCPU架构为研究背景,在其基础上分析了PMON的系统结构与工作流程,通过添加网络驱动程序,最终实现通过PMON加载Linux和Vxworks操作系统。进行必要的功能完善与性能优化,并经过严格的测试以排除可能存在的深层次缺陷,实现了一个性能稳定、功能完善、高可靠性的能与国产龙芯2F处理器平台紧密搭配的BIOS。  相似文献   

12.
介绍了MP3解码器的工作原理,分析了各个解码环节的计算量和消耗时间。将MP3解码过程中耗时最多的子带综合滤波环节使用矩阵乘法器单元做了优化和改进,提出一种可大幅度提高MP3实时解码效率的软硬件协同设计方法,并在SoC仿真平台上得到实时验证,达到了较好的优化效果。由于SoC的设计方法比较灵活,可以根据实际需要设计硬件模块,所以该设计具有方便、灵活和可靠性高等特点,是工程实用价值较高的解码器。  相似文献   

13.
基于"矩阵乘法"的网络最短路径算法   总被引:1,自引:0,他引:1       下载免费PDF全文
邓方安  雍龙泉  周涛  刘丽华 《电子学报》2009,37(7):1594-1598
 网络最短路径问题可以作为许多实际应用问题的模型,但传统的求解算法其迭代过程复杂.本文描述了基于矩阵乘法的最短路算法,其时间复杂度与Dijkstra算法相同.在给定的一个网络图中,在不改变网络图中的最短路的条件下,删除"多余"的结点或边,可以达到简化网络图和提高求解速度的目的,从而降低计算复杂性.最后,研究了该方法在最短路径问题和旅行商问题中的应用.实例表明,这种算法与传统的动态规划技术相比,具有运算简便、易于理解的优点.  相似文献   

14.
在分析费马数模乘特点的基础上,提出了一种新型的适于VLSI实现的,基于保留进位模加器(MCSA)的费马数模乘结构.理论仿真和综合的结果表明该结构能实现速度和面积上较优的权衡,通过这种模乘器能大大提高有大量这种运算的IDEA加密算法的运行速度.  相似文献   

15.
随着LTE与WLAN热点的大规模建设部署,为了综合利用WLAN与3GPP移动网络各自的优势,3GPPR9定义了3GPP与WLAN网络融合架构体系,并在3GPP与WLAN网间选择中引入ANDSF(Access Network Discovery Support Functions,接入网发现和选择功能单元)网络选择机制。本文在研究3GPP-WLAN融合参考体系架构与现有ANDSF网络选择机制基础上,针对ANDSF网络选择机制的不足,提出了一种基于智能终端用户业务感知与ANDSF相结合的网络选择增强方案,为融合架构中3GPP与WLAN网络切换提供了基础,有效提高用户体验与网络控制能力。  相似文献   

16.
1 IntroductionWiththedevelopmentofcomputersandinter net,therehasbeenarapidgrowthindigitalmulti mediainrecentyears.Itiseasytoduplicateal thoughitisfastandefficientforsignalprocessing .Anunlimitednumberofperfectcopiescanbeillegal lyproduced ,whichisaseriousthreattothecopyrightofauthors.Watermarkingcanbeusedforowneridentification ,royaltypayment,etc,byde terminingwhetherthedataisaltered ,orholdingthespecificinformationoftheowner[1~ 3] .Watermark ingtechnologyisaneffectiveapproachtosettlingil l…  相似文献   

17.
提出一种基于矩阵乘法共事方案的数字水印算法,将基于矩阵乘法共享方案的思想用于数字水印。算法在对水印信息隐藏前,对原始水印和分块水印都进行扰乱处理,然后对扰乱处理后的数字水印进行分存,也具有加密作用,算法具有很高的安全性。实验表明,算法还具有很好的隐藏效果和抗剪切功能。  相似文献   

18.
矩阵乘法是数值分析领域中一种十分常用的基本运算,被广泛应用于模式识别、图像和信号处理。由于矩阵运算具有局部性、一致性的特点,特别适合用二维网孔并行计算机来实现。文章讨论了基于二维网孔互连网络的矩阵乘并行算法的实现,首先给出了一种正方网孔处理机阵列的并行算法,然后将其推广到长方网孔处理机阵列中。最后通过在LSMPP计算机的应用,证明算法是可行的、有效的。  相似文献   

19.
20.
为了获得高码率低时延的多天线复正交空时分组编码矩阵,该文提出了一种未对信号进行线性处理的复正交空时分组编码矩阵的迭代式设计方法。利用该矩阵良好的正交性发射的信号,在接受端可以通过简单的最大似然解码算法来准确还原。借助计算机的帮助,得到该方法设计的多天线复正交空时分组编码矩阵的数据,与其他设计方法得到的复正交空时分组编码矩阵的数据进行了比较,结果显示该矩阵在最大码率和最小解码时延上封闭。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号