首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 75 毫秒
1.
主成分线性回归模型分析应用程序性能   总被引:3,自引:0,他引:3  
应用程序的性能分析能够给体系架构设计者和性能优化者提供有效的参考和指导.采用主成分线性回归模型分析了SPEC CPU2006的整型程序性能.模型选取性能监测单元采样到的事件为自变量,每条指令的时钟周期数(CPI)作为因变量.模型中采用主成分分析法消除了性能事件之间的相关性.实验结果表明,模型的拟合优度在90%以上,对性能进行预测的平均相对误差为15%.模型从量化上分析了L1,L2高速缓存缺失作为影响性能的关键因素是怎样影响程序性能的.  相似文献   

2.
SPEC CPU2017基准包中包含SPEC的下一代行业标准,是目前CPU性能评测的客观和可信的基准程序之一.采用SPEC CPU2017对Intel Cascade Lake架构的Intel Xeon Gold 6252N型号CPU做了不同内存频率、不同副本数、打开/关闭T urbo的组合测试,总结了不同应用程序在不同配置组合中的性能表现.同时,还对比测试了Intel Ivy Bridge架构的Intel Xeon E5-2692 v2型号CPU和Intel Haswell架构的Intel Xeon E5-2620 v3型号CPU,通过引入计算访存跑分比PBR的概念,分析了3种架构的硬件功能部件的增加对应用程序的性能影响.  相似文献   

3.
数据中心以可接受的成本承载着超大规模的互联网应用.数据中心的能源消耗直接影响着数据中心的一次性建造成本和长期维护成本,是数据中心总体持有成本的重要组成部分.现代的数据中心普遍采用DVFS(Dynamic Voltage Frequency Scaling,动态电压频率调节)来提升单节点的能耗表现.但是,DVFS这一类机制同时影响应用的能源消耗和性能,而这一问题尚未被深入探索.本文专注于DVFS机制对应用程序性能的影响,提出了一个分析模型用来量化地刻画应用程序的性能同处理器频率之间的关系,可以预测程序在任意频率下的性能.具体来说,依据执行时访问内存子系统资源的不同,本文把程序的指令为两部分:片上指令和片外指令,并分别独立建模.片上指令指仅需访问片上资源就可以完成执行的指令,其执行时间同处理器频率成线性关系;片外指令指需要访问主存的指令,其执行时间同处理器频率无关.通过上述划分和对每部分执行时间的分别建模,我们可以获得应用程序的执行时间同处理器频率之间的量化模型.我们使用两个不同的平台和SPEC 2006中的所有标准程序验证该模型,平均误差不超过1.34%.  相似文献   

4.
为了便于用户快速、直观地了解到机群系统中并行应用程序的性能情况,将Linux计算机群与Windows控制显示平台相结合,提出了一种基于事件的异构平台并行程序性能可视化方法.该方法以MPI作为底层编程环境,在高层使用MPE技术,依据动态性能检测方式获取程序执行过程信息;设计C#语言及Jumpshot日志图形化分析集成工具实现并行程序性能可视化.实验结果表明,该方法可准确,直观地反映程序性能信息,有助于程序员简便、有效地对并行程序进行量化分析,对提高机群系统的可用性、改善程序性能及效率等方面具有较高的实用价值.  相似文献   

5.
面向向量化的局部数据重组   总被引:1,自引:0,他引:1  
目前,利用微处理器的多媒体扩展对非多媒体程序的向量化已成为提高程序性能的一个重要手段.然而,和多媒体程序相比,非多媒体程序存在大量的非连续和非对齐的数据引用方式,严重影响程序的向量化发掘和向量化性能.提出一种新的向量化方法-基于局部数据重组的向量化技术(.通过改变局部数据的布局,将循环中不连续的数据引用变为连续的数据引用,进而完成对循环的向量化;并对数据引用作对齐分析和对齐优化,从而提高程序的向量化性能.以SPEC CPU2000浮点测试集为例,该方法不仅可以向量化对于ICC编译器无法向量化的程序,而且对这些程序都有很好的性能提升,在当前的测试环境下某些程序性能最高可提高241.6%.  相似文献   

6.
阐述了一种基于VMM(virtual machine manager)的虚拟机缓存划分的设计与实现。该方法采用操作系统中的页面着色技术,在虚拟机管理器Xen上进行实现。这种机制对于VMM之上的客户操作系统是完全透明的,便于操作,具有很好的灵活性。经测试表明,提出的缓存划分的方法能够显著地提高同时运行在不同虚拟机上的应用程序的性能。对从SPEC CPU 2006基准测试程序里面挑选出来的并发程序的负载进行测试,结果表明缓存划分最高可以使其性能提升19%。  相似文献   

7.
基于事件跟踪的并行程序性能分析,就是通过分析各处理器采集的事件记录、计算程序对象的执行时间和探究事件间的相互关系,来揭示程序的性能问题。这一工作要求各处理器采集的事件时戳必须具有可比性。由于各种原因,通过测量获得的事件时戳往往是不同步的,这直接影响性能分析工作的开展。介绍处理器时钟误差的概念及产生原因、并行程序性能分析中的测量误差、时钟条件和时戳同步需求,最后介绍一种基于恒定时钟漂移的线性误差插值技术,在一定程度上解决了并行程序性能分析中的时戳同步问题。  相似文献   

8.
面向非多媒体程序的SIMD向量化算法的研究及改进   总被引:3,自引:0,他引:3  
利用微处理器的多媒体扩展对非多媒体程序的向量化已成为提高程序性能的一个重要手段,然而目前几乎所有的商业编译器对非多媒体程序的向量化的结果,都无法说明其编译器有效的向量能力.本文通过分析典型的非多媒体程序——SPECCPU2000浮点程序,归纳出非多媒体程序的SIMD向量化特征,并依此提出局部数据重组的向量化方法、针对外层循环的向量化方法、部分语句SLP的向量化方法几种新的向量化方法和相关的向量化优化技术.通过对比Intel编译器对SPEC CPU2000的向量化性能测试,可以发现本文提出的改进方法有效的提高了程序的向量化.  相似文献   

9.
龙芯2号处理器的同时多线程设计   总被引:1,自引:0,他引:1  
提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明,龙芯2号同时多线程处理器通过挖掘线程级并行性,将龙芯2号处理器的性能提高了31.1%.  相似文献   

10.
赵家程  崔慧敏  冯晓兵 《软件学报》2013,24(11):2558-2570
普遍认为,云计算和多核处理器将会统治计算领域的未来.但是,目前云计算数据中心的计算资源使用率非常低,其主要原因在于多核处理器上存在严重且不可预知的性能干扰.为了保证关键应用程序的QoS,只能禁止这些关键程序与其他程序共同运行,导致了资源的过度分配.为了提高数据中心的利用率,分析多核间的性能干扰成为一个关键的问题.观察到程序遭受的核间性能干扰可以表示为内存子系统总压力的线性分段函数,而与构成压力的具体应用程序无关.以此观察为基础,提出了一种基于统计学习的多核间性能干扰分析方法,使用主成分线性回归的方法获得干扰模型,可以精确且定量地预测任意程序由于内存子系统资源竞争导致的性能下降.实验结果表明,平均预测误差仅为1.1%.  相似文献   

11.
空间信息的存储和处理问题是地理信息系统(GIS)的核心问题.对空间数据和属性数据的统一存储管理已成为必然趋势.本文通过对GIS中海量数据的存储方式进行研究,指出对象-关系型的数据库存储方式是空间数据库的发展方向.在此基础上讨论了Hibernate技术与GIS数据库的结合,使用Hibernate技术将关系数据库中空间数据和属性数据进行封装,屏蔽了数据库底层操作,使得程序员可以用面向对象的思想随意操纵数据库,在利用了关系数据库的快速检索、查询能力的同时也增强了数据的一致性和可移植性.  相似文献   

12.
自卫干扰对无人机敏感性的影响研究   总被引:2,自引:0,他引:2       下载免费PDF全文
研究了单架无人机在突防地空导弹系统的过程中,自卫干扰对无人机敏感性的影响,分析了自卫干扰在敏感性各个环节的作用,仿真分析了平均干扰功率对无人机最小暴露半径、被探测到的概率、脱靶距离及被击中概率的影响。仿真结果表明,使用自卫干扰技术能有效地降低无人机的敏感性,从而提高其作战生存力。研究结果可为无人机敏感性评估、生存力增强措施的研究及雷达探测系统的效能评估提供一定的依据。  相似文献   

13.
介绍基于LabVIEW的钢材表面裂纹定量检测原理,设计了基于LabVIEW的钢杆裂纹定量检测系统,并对钢杆表面横向裂纹缺陷进行模拟实验,初步建立数学模型,通过评判Vpp得到反映裂纹状况的定量检测结果,从而验证了该方法的可行性和有效性,并得出相关的结论。  相似文献   

14.
采用流体动力学方法研究了GL-5000P探空仪湿度传感器的防雨帽对湿度测量的影响.运用Pro/E对湿度测量系统结构进行建模,使用前处理软件ICEM对其进行网格划分,导入Fluent软件进行稳态和瞬态计算分析.模拟结果表明:GL-5000P防雨帽很好地防止了高空云雨滴对湿度传感器的影响,其兼具一定的防太阳辐射功能,但高空25 km以上防辐射能力减弱,甚至起相反作用;防雨帽厚度对太阳辐射误差影响较小,而其反射率影响则较显著;瞬态分析揭示了传感器表面的湿度场分布产生了时间滞后,且时间滞后常数随海拔高度的升高而增加,到27 km达到0.42 s.该研究为湿度垂直廓线的时间滞后修正提供了理论依据.  相似文献   

15.
基于SAML单点登录安全服务体系的应用研究   总被引:5,自引:0,他引:5  
安全断言标记语言SAML是让互相信赖的双方可以交换安全相关信息的一个XML架构,它定义了不同系统之间安全服务交换认证和授权信息的机制,单点登录技术SSO是实现集成身份认证和授权服务的有效方法,通过对传统的SSO分析,提出一种基于SAML、利用PKI/PMI的单点登录企业级的应用系统,有效解决跨域系统和异构应用平台的一次认证、全程访问的安全信息交换;成功在“金税三期”资源整合中界面整合及门户项目得到应用。  相似文献   

16.
采用嵌入式EPXA10为核心,以污水车自动泄放机器人为应用对象,本文介绍一种双目视觉定位系统。提出一种利用模糊算法进行目标图像的边缘检测,并结合双目视觉定位的算法实现机器视觉定位的方法。针对污水泄放机器人的工作特点,采用主动寻找特殊图的方法,达到快速准确对目标跟踪定位的目的,完成对污水车泄放口的三维定位,机器人根据定位坐标可以准确地接通污水泄放管,快速把污水泄放到池中。  相似文献   

17.
矩阵乘法是数值分析以及图形图像处理算法的基础,通用的矩阵乘法加速器设计一直是嵌入式系统设计的研究热点。但矩阵乘法由于计算复杂度高,处理效率低,常常成为嵌入式系统运算速度的瓶颈。为了在嵌入式领域更好地使用矩阵乘法,提出了基于MPSoC(MultiProcessor System-on-Chip)的软硬件协同加速的架构。在MPSoC的架构下,一方面,设计了面向硬件约束的矩阵分块方法,从而实现了通用的矩阵乘法加速器系统;另一方面,通过利用MPSoC下的多核架构,提出了相应的任务划分和负载平衡调度算法,提高了并行效率和整体系统加速比。实验结果表明,所提架构及算法实现了通用的矩阵乘法计算,并且通过软硬件协同设计实现的多核并行调度算法与传统单核设计相比在计算效率方面得到了显著的提高。  相似文献   

18.
应用层多播协议通过生成树向其组成员发送数据包,一个节点失效则会引起生成树的分裂,并导致下游成员节点无法接收数据包,这正体现了应用层多播系统的脆弱性。为提高应用层多播的健壮性,提出一种基于K叉平衡树结构的应用层多播树构建的改进方案。  相似文献   

19.
主要考察背景流量对FTP业务传输质量的影响。首先简要介绍了OPNET仿真软件,然后对某公司的广域网网络进行仿真,建立两个场景,分别不设背景流量和加载背景流量,最终得出背景流量对FTP业务传输的影响曲线。结论为:背景流量可令链路平均利用率、链路平均吞吐量提高,但是当仿真达到稳定状态之后,随着链路负载的增大会导致FTP下载平均响应时间增加。  相似文献   

20.
研究导弹垂直发射装置中导向轨对导弹出筒时状态影响问题,并对导向轨进行改进设计。为了能够准确有效地获得导向轨作用力对导弹出筒状态影响规律,将接触碰撞模型引入导向轨和导弹接触区域间隙中,采用拉格朗日运动学方程,建立导弹的垂直发射动力学模型,计算导弹发射过程中振动特性曲线;通过分析发现,导弹发射筒与导向轨边界约束作用是影响导弹出筒口振动的重要因素。为了降低出筒时的振动,提高导弹出筒平稳性,增加锁紧装置设计。通过对比有无锁紧装置系统响应,表明锁紧装置对吸收导弹发射时冲击振动,减小导弹发射振动幅值有积极作用,为提高导弹出筒时的平稳性提供了科学依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号