期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郭辉黄立波郑重隋兵才王永文《计算机工程与科学》2021,43(4):579-585

性能验证及评估是通用处理器设计实现过程中最重要且必须实施的关键步骤之一.高效的通用处理器原型系统性能评估方法不仅可以帮助处理器设计人员在处理器设计阶段尽早地定位性能设计缺陷,而且还可以在设计流片前验证处理器能否达到性能设计预期.然而,对处理器原型系统进行完整的性能测试需要运行较长的时间,这样巨大的时间开销导致设计人员无法及时进行性能设计分析,进而导致处理器原型系统的性能评估成为整个项目的瓶颈.提出了一种快速精确的通用处理器原型系统性能评估方法Proto-Perf.Proto-Perf性能评估方法使用动态程序分析方法和基本块聚合技术抽取测试程序的特征程序片段进行测试,显著地缩短了性能测试时间.实验结果表明,相比于完整运行SPEC CPU2006 REF数据规模测试程序获得的性能数据,使用Proto-Perf测试得到的性能数据的绝对误差平均达到1.53％,其中最高达到7.86％.并且,对于实验中的每个程序,使用Proto-Perf方法进行测试的时间都明显缩短. 相似文献

2.

高通量计算在大规模人群队列基因组数据解析应用中的挑战

曾瀞瑶苑娜魏文娟李根杜政霖《数据与计算发展前沿》2020,2(1):117-127

【目的】为推动精准医学研究的发展,世界各国相继开展大规模人群队列基因组测序计划,通过对数以万计个体进行全基因组测序,构建人群特异的基因组变异图谱。这些海量基因组数据产出,对计算速度和计算通量提出了新的要求,迫切需要速度更快、通量更高的计算平台来处理与解读这些生物序列信息。由于基因组数据自身的特点、数据解析过程的多样性和复杂性,致使在大规模人群基因组变异解析中高通量计算资源的使用效率低、计算速度慢、耗时长,服务器与本地数据交换不便,因此需要针对基因组变异解析进行多方面优化,通过软硬件开发来解决应用中存在的多种问题。本文拟对这些优化方法进行分析和综述。【方法】在高通量计算系统中,系统IO瓶颈问题是基因组变异解析并行化效率低的主要原因,通常采用基于分布式非结构化存储数据库以及对象存储系统,以提升IO的大规模可扩展能力,解决分析流程中存在的IO问题;同时通过基因组数据的高效压缩算法,可减少数据IO和传输压力。为了加快基因组数据解析速度,可在软件上采用神经网络等算法优化基因组解析方法,在硬件上使用FPGA(现场可编程逻辑门阵列)或GPU异构计算,以提高数据处理速度。【结果】综合来看,以上多方面的优化可以大幅提升基因组数据分析中高通量计算的性能,解决基因组数据处理中的存储墙问题,提高高通量计算资源的使用效率,大大减少全基因组变异解析的计算时间。【结论】高通量计算在基因组数据解析应用中存在的多种问题,可通过软硬件开发和优化得以解决,从而显著改进高通量计算在大规模人群队列变异解析应用中的计算效率,促进今后人群队列基因组研究与应用的广泛开展。相似文献

3.

蚁群:一种新型的高效多用计算平台

谢向辉钱磊吴东原昊李祥《计算机研究与发展》2015,52(6)

在科学计算和大数据处理应用需求的推动下,高性能计算机的性能不断提升、系统规模日益扩大,系统功耗越来越成为制约能力提升的重要瓶颈.在深入分析现有4类高性能计算机的基础上探讨了2项关键技术:1)可重构微服务器(reconfigurable micro server,RMS)技术.解决单个计算节点在领域应用加速能力、系统功耗和体积间的平衡兼顾问题.2)自治与分治相结合的集群构造技术.解决基于微小型化计算节点的大规模计算平台构造与扩展性问题.在此基础上,提出了一种新型的高效多用计算平台架构——“蚁群”,构建了包含2 048个低功耗、微小型化RMS计算节点的蚁群平台原型系统,并实现了大规模指纹实时比对和多RMS节点协同排序2个典型应用.测试表明,单个RMS节点的指纹比对性能是Xeon单核的34倍,功耗仅5W,整个原型系统可实现千万量级指纹库的数百并发实时查询;蚁群平台的数据排序性能功耗比是GPU平台的10倍以上,有效提升数据排序的效率. 相似文献

4.

基于机器学习的多语言文本抽取系统实现

《计算机应用与软件》2017,(4)

基于统计机器学习的信息抽取方法正日益成为研究的热点,在研究与应用方面虽然也产生了一些实用的基于机器学习的文本信息抽取框架与系统,但大多面临着交互性弱、可扩展性低、语言移植能力差等缺陷。为此,研究并提出一种通用可行的支持多语言的信息抽取框架,并基于该框架实现了一个原型系统。原型系统集成了最大熵、支持向量机两种机器学习算法,使用这两种算法对中英文文本的实验验证了系统的实用性。相似文献

5.

透明计算系统端计算机间的数据传送方法

下载免费PDF全文

徐广斌匡文渊周悦芝《计算机工程》2008,34(17):1-3

提出一种透明计算系统中端计算机间的数据传送方法,该方法通过将数据传送的控制信息和传送的数据分离,省去数据在网络上的传送过程,从而提高对传送请求的处理速度,减少对相关资源的占用,通过优化服务器对传送请求的调度处理,改善系统整体的响应速度和性能。在基于龙芯平台的透明计算原型系统中实现了上述方法,并作了性能测试和分析,验证了该方法的有效性。相似文献

6.

主动式信息安全服务系统的研究

庄毅刘坤王建东潘龙平《小型微型计算机系统》2006,27(3):442-445

为了提高信息安全技术在应用系统中的主动性，利用Agent的智能性和可移动性特点，提出了一种基于Agent的主动式信息安全服务系统的模型．详细介绍了两类安全功能Agent的结构．采用JADE平台，实现了原型系统．实验数据分析表明：原型系统可为应用系统主动提供用户认证、加／解密、数字签名／验证等信息安全服务功能．相似文献

7.

面向国产CPU的可重构计算系统设计及性能探究

下载免费PDF全文

彭福来于治楼陈乃阔耿士华李凯一《计算机工程与应用》2018,54(23):36-41

为了提升国产平台的计算性能,采用国产CPU+FPGA的异构架构,设计了基于国产CPU的可重构计算系统。该系统包括基于国产CPU的主机单元和FPGA可重构加速单元,主机单元负责逻辑判断与管理调度等任务,FPGA负责对计算密集型任务进行加速,并采用OpenCL框架模型进行编程,以缩短FPGA的开发周期。为了验证该系统的性能,采用AES加密算法来测试该系统的计算性能,通过对不同长度的明文进行AES加密测试,并与CPU串行处理结果进行对比,得出：相比于单核FT-1500A CPU串行加密方式,采用可重构计算系统并行加密能够获得120多倍的加速比,且此加速比会随着明文长度的增加而成非线性增大。实验结果表明：基于国产CPU的可重构计算系统能够大幅提升国产平台的计算性能。相似文献

8.

计算经济中的网格监测体系结构

马满福吴健陈丁剑邓磊胡正国《计算机工程》2006,32(12):114-116

网格监测是实现网格资源有效调度的基础，它采集、传输和分析各种资源的运行数据，由此实现性能评估、错误发现以及预测等，最终改善系统的性能。针对网格资源管理中的计算经济模型，提出了一个4层的网格监测体系结构；设计了监测中的数据处理管理、监测数据交换；对体系结构中的模块组成和实现问题进行了讨论，在GRACE上实现了原型系统。通过实验证明实现的监测体系结构是有效的。相似文献

9.

基于SCMA的端信息扩展多用户安全通信系统研究

石乐义兰茹段鹏飞韩强《计算机研究与发展》2021,58(11):2444-2455

端信息扩展技术使用多项端信息组成的扩展序列来表示身份信息,各项端信息与所传递的数据本身无关,从而隐藏用户的真实信息.然而,端信息扩展序列资源利用率低、自相关性弱,无法实现多用户并发安全通信对此,将稀疏码多址接入(sparse code multiple access,SCMA)技术引入端信息扩展序列生成过程中,提出基于SCMA的端信息扩展多用户安全通信系统模型,详细阐述了模型中的码本设计分配、码字加载发送策略.进一步,从安全性能和通信服务质量2方面对原型系统进行理论分析和实验验证.实验结果表明:基于SCMA的端信息扩展多用户安全通信系统可实现用户信息的隐蔽传输,服务器端能够正确区分用户信息采用稀疏编码后,系统具有较低误比特率,且在一定过载条件下,仍具有良好的传输性能. 相似文献

10.

基于SCMA的端信息扩展多用户安全通信系统研究

石乐义兰茹段鹏飞韩强《计算机研究与发展》2021,58(11):2444-2455

端信息扩展技术使用多项端信息组成的扩展序列来表示身份信息,各项端信息与所传递的数据本身无关,从而隐藏用户的真实信息.然而,端信息扩展序列资源利用率低、自相关性弱,无法实现多用户并发安全通信对此,将稀疏码多址接入(sparse code multiple access,SCMA)技术引入端信息扩展序列生成过程中,提出基于SCMA的端信息扩展多用户安全通信系统模型,详细阐述了模型中的码本设计分配、码字加载发送策略.进一步,从安全性能和通信服务质量2方面对原型系统进行理论分析和实验验证.实验结果表明:基于SCMA的端信息扩展多用户安全通信系统可实现用户信息的隐蔽传输,服务器端能够正确区分用户信息采用稀疏编码后,系统具有较低误比特率,且在一定过载条件下,仍具有良好的传输性能. 相似文献

11.

基于蓄冷技术的CPU散热系统

《电子制作．电脑维护与应用》2017,(22)

随着家用电脑CPU性能的提升,发热功耗也相应的快速上升,针对散热系统的性能要求也越来越高,而散热能力也往往成为性能进一步提高的瓶颈。本文提出了一种基于蓄冷技术的CPU散热系统,通过冰块的蓄冷与水循环散热相配合,提高CPU散热系统的能力,从而达到提高CPU超频的能力,并通过实验对相关系统性能进行了验证。相似文献

12.

FC-SAN中的数据放置和访问路径选择的代价模型

下载免费PDF全文

李超周立柱邢春晓《软件学报》2004,15(5):741-751

网络化存储通过引入网络的概念将存储独立于服务器甚至通信网络,已经成为传统存储方式的有力替代者.然而,FC-SAN虚拟存储方式的存储性能依赖于存储对象的某些属性,在某些情况下,其性能甚至不如传统的LAN数据共享方式.就FC-SAN虚拟存储方式中的数据放置和访问路径选择对这一问题进行了研究.首先通过分析虚拟存储原理提出了一个数据访问耗时的线性模型;然后,就数据放置和访问路径选择提出了一个决策方法;并在进一步探讨这一方法的过程中，定义了“虚拟存储代价当量”的概念，用以评价FC-SAN虚拟存储环境中的数据放置的代价，从而为评价以及如何选择数据放置和访问路径提供了一种定量的手段.最后，在数字图书馆的一个海量存储原型系统中对上述的理论分析、各种条件进行了实验验证，并结合实际给出了“虚拟存储代价当量”的计算方法，验证了所提出的方法的有效性. 相似文献

13.

服务网格性能优化关键技术研究

杨怡滨杨伟于新容丘伟森《计算机应用与软件》2021,38(11):24-30,85

服务网格(Service Mesh)是用于处理服务间通信的专用基础设施层.为了有效提升其性能,从并发处理模型和交互协议两个方面研究服务网格的性能优化方法,分别提出基于Reactor设计模式的服务网格高并发处理模型和面向服务网格的轻量级、自定义的代理交互协议,并实现一个服务网格原型系统.通过实验与当前主流的开源服务网格系统Linkerd和Envoy进行性能对比分析,实验结果表明该方法能够显著提升服务网格的并发处理性能,使实现的原型系统在并发处理和通信方面都有良好的性能表现. 相似文献

14.

融合聚类触发对特征的最大熵词性标注模型 总被引：7，自引：0，他引：7

赵岩王晓龙刘秉权关毅《计算机研究与发展》2006,43(2):268-274

为解决传统HMM词性标注模型不能包含远距离词特征的问题，提出了形如“WA→WB／TB”的触发对来承载远距离词特征信息，并采用平均互信息量度对触发对特征进行选择．在最大熵框架下，将选择后的触发对特征加入到词性标注系统中．利用矢量空间模型提供的语义相似度计算功能进行词语聚类，聚类的结果和语义词典融合，建立聚类触发对特征用来解决触发词“％”的数据稀疏问题．实验结果表明，与HMM相比，融合了聚类触发对特征的最大熵模型标注错误率减少了34％．相似文献

15.

大论战：CPU、GPU谁更重要？

ChenY 《微型计算机》2008,(16):5-6

当PC进入视觉计算时代之后,人们开始发现Pc性能的提升对于GPU的依赖性已经超过了CPU。“CPU、GPU谁更重要”,“GPU是否会取代CPU成为PC核心”,“未来是CPU取代GPU,还是GPU取代CPU”等一系列的争论成为了最近人们讨论最多的话题。相似文献

16.

基于多策略原型生成的低资源神经机器翻译

下载免费PDF全文

于志强余正涛黄于欣郭军军线岩团《软件学报》2023,34(11):5113-5125

资源丰富场景下,利用相似性翻译作为目标端原型序列,能够有效提升神经机器翻译的性能.然而在低资源场景下,由于平行语料资源匮乏,导致不能匹配得到原型序列或序列质量不佳.针对此问题,提出一种基于多种策略进行原型生成的方法.首先结合利用关键词匹配和分布式表示匹配检索原型序列,如未能获得匹配,则利用伪原型生成方法产生可用的伪原型序列.其次,为有效地利用原型序列,对传统的编码器-解码器框架进行改进.编码端使用额外的编码器接收原型序列输入;解码端在利用门控机制控制信息流动的同时,使用改进的损失函数减少低质量原型序列对模型的影响.多个数据集上的实验结果表明,相比基线模型,所提出的方法能够有效提升低资源场景下的机器翻译性能. 相似文献

17.

基于ARM的硬件压缩算法在Spark中的性能研究

朱常鹏汤景仁梁昀张小川韩博赵银亮《计算机学报》2023,(12):2626-2650

鲲鹏920 CPU是2021年面世、全球第一款基于7纳米制造工艺的ARM 64位CPU，该CPU内置一个名为KAEzip的硬件加速引擎，其核心是一个硬件压缩算法，能通过硬件提升压缩与解压缩性能.相关研究表明，压缩算法的硬化与传统软件压缩算法相比具备明显性能优势.但大数据领域中的基础性系统软件都无法识别和使用这类算法.因此研究评估硬件压缩算法在大数据环境下的性能，发现揭示制约这类算法性能的关键因素以及可能存在的缺陷具有重要意义.为此，本文首先提出一种基于“生产-消费”模型的Spark任务性能模型，形式化地表示多维资源、压缩算法和Spark任务性能之间的内在关系，从理论上分析揭示出Spark下影响压缩算法性能的关键因素.然后提出一种三层架构支持Spark识别使用硬件压缩算法.这种分层架构为进一步调优硬件压缩算法在Spark中的性能提供了灵活性，也能复用到其他大数据系统软件.在此基础上本文以KAEzip为实验对象，使用经典Spark基准测试程序全面评估它在Spark中的性能，结合性能模型分析挖掘制约KAEzip性能的关键因素与根源.对KAEzip的测试表明：（1）硬件压缩算法可有效提升Spa... 相似文献

18.

广播机制解决Shuffle过程数据倾斜的方法

下载免费PDF全文

吴恩慈《计算机系统应用》2019,28(6):189-197

在Spark计算平台中，数据倾斜往往导致某些节点承受更大的网络流量和计算压力，给集群的CPU、内存、磁盘和流量带来了巨大的负担，影响整个集群的计算性能.本文通过对Spark Shuffle设计和算法实现的研究，深入分析在大规模分布式环境下发生数据倾斜的本质原因.提出了广播机制避免Shuffle过程数据倾斜的方法，分析了广播变量分发逻辑过程，给出广播变量性能优势分析和该方法的算法实现.通过Broadcast Join实验验证了该方法在性能上有稳定的提升. 相似文献

19.

基于同态加密的隐私保护逻辑回归协同计算

杨越佳华蓓钟志威高咪《计算机工程》2023,(4):23-31

随着数据交易市场的建立和规范化，多方协同进行机器学习建模成为新需求。联邦学习允许多个数据拥有方联合训练一个机器学习模型，适用于模型共建共用场景，但现有联邦学习计算框架无法适用于数据拥有方和模型需求方诉求不同、模型共建不共用的场景。提出一种不依赖于第三方计算平台且基于同态加密的隐私保护逻辑回归协同计算方案，包括由数据拥有方、模型需求方和密钥生成者构成的多方协同计算框架，以及基于该框架的多方交互协同计算流程，在不泄露模型信息及各方数据隐私的前提下协作完成模型训练任务，通过建立攻击模型分析协同计算方案的安全性。基于先进的浮点数全同态加密方案CKKS在小型计算机集群上实现协同计算的原型系统，并对原型系统进行计算和通信优化，包括提前终止训练和将密文同态运算卸载到GPU上提高计算效率。实验结果表明，计算优化措施获得了约50倍的速度提升，协同计算原型系统在中小规模的数据集上可满足实用性要求。相似文献

20.

基于普适计算的工程协同设计系统模型

吴炜煜刁明光陈浩《计算机应用》2009,29(1):301-303

论述了建筑工程协同设计系统的建模特点,在已提出并实现了基于网络的协同设计系统的工作基础上,进一步提出了物理协同的概念,对所设计的理想“协同设计院”模型做了说明,给出了信息交流和数据交流的解决方案,并论述了实现“协同设计院”的开发中应遵循的原则。最后介绍了原型系统的研制情况,实验证明了该理论模型的可行性和广阔发展前景。相似文献