期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

华夏朱铮皓徐聪张曦煌柴志雷陈闻杰《计算机应用》2023,(3):827-834

在分布式计算平台上运行大规模的脉冲神经网络（SNN）是提升类脑计算智能水平的基本手段之一,它的难点在于如何将SNN部署到对应数量的计算节点上,使整体系统的运行能效最佳。针对以上问题,在基于NEST的SNN工作负载自动映射器（SWAM）的基础上,提出一种基于精准通信建模的SNN工作负载自动映射器（SWAM2）。在SWAM2中,基于NEST仿真器对SNN工作负载的通信部分进行精准建模,并改进工作负载模型中参数的量化方法,设计了最大网络规模预测方法。在SNN典型案例上的实验结果表明,在工作负载通信以及计算时间的预测中,SWAM2的平均预测误差比SWAM分别降低12.62和5.15个百分点;在对工作负载最佳映射的预测中,SWAM2的平均准确率为97.55%,比SWAM高13.13个百分点。SWAM2通过自动预测SNN工作负载在计算平台上的最佳部署/映射,避免了手动反复实验的过程。相似文献

2.

SWAM:SNN工作负载自动映射器

郁龚健张鲁飞李佩琦华夏刘家航柴志雷陈闻杰《计算机科学与探索》2021,15(9):1641-1657

为了满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台.因此,如何快速为SNN工作负载确定合理的计算节点数(即如何把工作负载合理映射到计算平台上)以获得最佳的性能、功耗等指标就成为类脑计算系统需解决的关键问题之一.首先分析了SNN工作负载特性并为其建立起计算模型;然后针对NEST类脑... 相似文献

3.

基于联合权重超图划分的SNN负载均衡方法

徐聪叶均超黄尧柴志雷《计算机应用研究》2023,40(7)

大规模脉冲神经网络并行模拟是探究大脑机能的重要手段。其难点在于合理地将负载映射到并行分布式平台上,提升模拟速度。为解决该问题,提出一种基于联合权重超图划分的SNN负载均衡方法,解决并行计算中进程间计算负载与通信负载的均衡问题,提高SNN模拟速度。并使用稀疏通信的方式替代集体通信,解决事件通信过程中的数据冗余问题,提升通信效率。实验结果表明,该方法使带有STDP突触20%规模的皮质层微电路模型的模拟时间,比标准循环分配算法缩短约64.5%,比普通超图分配算法缩短约57.4%,同时事件通信数据量减少了90%以上。相似文献

4.

神经元计算机操作系统的资源分配方法

王凤娟吕攀金欧文邢庆辉邓水光《计算机研究与发展》2023,530(9):1948-1959

神经形态计算硬件是专为运行脉冲神经网络（spiking neural network, SNN）应用而设计的专用计算机系统. 随着硬件资源规模的增大,神经元计算机能够支持更多数量的SNN应用并发运行,如何有效地为SNN应用分配神经形态计算硬件资源变得极具挑战性. 首先提出一种神经元计算机操作系统的资源分配框架,在加载SNN应用到神经形态计算硬件时分配硬件资源以及建立对应的输入输出路由,实现了资源分配过程与编译器间的解耦. 其次,创新性地引入了最大空矩形（maximum empty rectangle, MER）算法来处理神经形态计算硬件资源的动态分配问题;针对SNN应用的脉冲输入输出特性,提出了一种最小化脉冲输入输出通信代价的资源分配算法,旨在降低脉冲输入输出能耗、延迟和资源碎片. 实验结果显示,所提算法比现有算法表现出较好的性能,其中脉冲输入输出平均延迟最高降低了81%,碎片率降低了92%.

相似文献

5.

基于ZYNQ集群的神经形态计算加速研究与实现

下载免费PDF全文

张新伟李康郁龚健刘家航李佩琦柴志雷《计算机工程与应用》2020,56(21):65-71

基于脉冲神经网络（SNN）的神经形态计算由于工作机理更接近于生物大脑,被认为有望克服深度学习的不足而成为解决人工智能问题的更佳途径。但是如何满足高性能、低功耗和适应规模伸缩需求是神经形态计算系统需要解决的挑战性问题。基于FPGA异构计算平台ZYNQ集群,在NEST类脑仿真器上,重点解决了具有脉冲时间依赖可塑性（STDP）突触计算复杂度高、并行度低、硬件资源占用大的问题。实验结果表明,设计的方法在8节点ZYNQ 7030集群上,性能是Xeon E5-2620 CPU的14.7倍。能效比方面,是Xeon E5-2620 CPU的51.6倍,是8节点ARM Cortex-A9的20.6倍。相似文献

6.

PEST:由PYNQ集群实现的高能效NEST类脑仿真器

李佩琦郁龚健华夏刘家航柴志雷《计算机科学与探索》2021,15(11):2127-2141

高性能且低功耗地进行大规模类脑仿真是类脑计算所需解决的最具挑战的问题之一.目前类脑计算的实现方式主要分为硬件实现和软件实现两种.通过硬件实现的专用类脑计算芯片与系统可以提供更佳的能效指标,但代价高、适应性差;基于软件方式的仿真(如NEST)拥有完整的应用生态,可用性好但存在计算速度慢的问题.如果将两种实现方式相结合,通过软硬件协同设计,可以在保证良好应用生态的同时获得更高的计算能效,提出了一种基于FPGA异构平台PYNQ集群的NEST类脑仿真器的高能效实现(PEST).通过构建大规模PYNQ集群,设计软硬件数据交互接口实现基于NEST仿真器的规模可伸缩类脑计算系统,针对IAF神经元进行FPGA硬件电路设计,利用MPI分布式计算等方式提升了NEST计算效率.实验结果表明:针对不同的计算模型,在PYNQ集群最佳适配情况下,PEST上神经元更新部分的性能相比AMD 3600X提升超过4.6倍,相比Xeon 2620提升超过7.5倍;PEST的更新能效比相比3600X提升超过5.3倍,相比Xeon 2620提升超过7.9倍. 相似文献

7.

基于FPGA的类脑计算平台通用系统架构设计

朱铮皓华夏徐聪柴志雷《单片机与嵌入式系统应用》2022,22(6):18-21

目前,类脑计算所面临的最具挑战性的问题之一是如何高性能且低功耗地进行大规模类脑仿真。本文选用应用生态完整、支持大规模仿真的NEST类脑仿真器,针对NEST类脑仿真器可移植性差、仿真速度慢等问题,设计了一种ARM+FPGA的类脑计算平台的通用性系统架构。本设计采用硬件加速神经元计算模块、通用数据传输接口设计、软硬件协同设计等方法提升了NEST类脑仿真器的性能。在3款类脑计算平台上证明了该架构的可行性,为类脑计算平台提供了一种通用解决方案。相似文献

8.

改进的基于蚁群算法的非均匀分簇路由协议

下载免费PDF全文

廖福保张文梅《计算机测量与控制》2017,25(4):26-26

针对无线传感器网络中传感器节点随机分布造成能耗不均和“热区”等问题,提出了一种改进的基于蚁群算法的非均匀分簇路由协议。该协议也采用“轮”方式运行,每轮簇首选举开始阶段,根据节点剩余能量、节点密度,结合节点到Sink节点的距离来构造不均匀的竞选半径,每个节点根据竞选半径范围内邻居节点计算剩余能量比及距离偏差平均值,从而计算出其簇首竞争等待时间,采用时间等候簇首竞选机制来选举出簇首,平衡簇内的通信能耗;数据传输阶段,考虑剩余能量、通信能耗、链路质量、传输时延等因素,采用改进的蚁群算法构造最优传输路径,数据传输的同时更新信息素,从而达到自适应、动态优化地建立和维护传输路径。仿真结果表明,该路由协议能有效节约能量和均衡能耗,延长网络生命周期,改善链路质量,减少传输时延。相似文献

9.

移动无线传感器网络自适应信标交换算法 总被引：2，自引：0，他引：2

张衡阳李莹莹刘云辉《软件学报》2008,19(11):3033-3041

针对移动无线传感器网络中周期性信标交换引起的通信暂盲现象,提出一种自适应信标交换算法.在该算法中,工作节点根据相对于上游节点的特征量动态地计算下一次信标交换周期,空闲节点根据相对于所有邻居节点的特征量动态地计算下一次信标交换周期,或者采用周期性信标交换.该算法可以根据网络通信性能要求调整门限概率值来得到合适的信标交换周期;并通过信标反馈等待超时的方法删除被选择为下一跳但已移出的节点.仿真实验结果表明,该算法在工作节点稀疏型网络中不但提高了数据包传送成功率,而且降低了控制开销,可适用于大规模移动无线传感器网络. 相似文献

10.

一种优化MapReduce系统能耗的数据布局算法

宋杰王智李甜甜于戈《软件学报》2015,26(8):2091-2110

在云计算技术和大数据技术的推动下,IT资源的规模不断扩大,其能耗问题日益显著.研究表明:节点资源利用率不高、资源空闲导致的能源浪费,是目前大规模分布式系统的主要问题之一.研究了MapReduce系统的能耗优化.传统的基于软件技术的能耗优化方法多采用负载集中和节点开关算法,但由于MapReduce任务的特点,集群节点不仅要完成运算,还需要存储数据,因此,传统方法难以应用到MapReduce集群.提出了良好的数据布局可以优化集群能耗.基于此,首先定义了数据布局的能耗优化目标,并提出相应的数据布局算法;接着,从理论上证明该算法能够实现数据布局的能耗优化目标;最后,在异构集群中部署3种数据布局不同的MapReduce系统,通过对比三者在执行CPU密集型、I/O密集型和交互型这3种典型运算时的集群能耗,验证了所提出的数据布局算法的能耗优化效果.理论和实验结果均表明,所提出的布局算法能够有效地降低MapReduce集群的能耗.上述工作都将促进高能耗计算和大数据分析的应用. 相似文献

11.

基于极大团的边缘云节点聚合算法

朱金彬武继刚隋秀峰《计算机科学》2018,45(4):60-65

组合多个边缘云可以向用户提供更强大的云计算服务,在大量边缘云节点集合中选择适当的节点进行组合是一项具有挑战性的任务。该问题被建模成由云节点作为顶点、节点之间的链路作为边的资源拓扑图。云组合的构建过程等同于在该图中选择子图的过程,这是一个NP完全问题。子图的选择策略是决定云组合性能的重要因素,现有的minStar算法贪心地选择节点之间通信延迟最小的子图,将最优资源分配给当前用户,导致了局部最优和全局性能不良的问题。鉴于此,提出基于极大团的边缘云资源分配算法,提取图中的极大团并将其划分为若干互不重叠的规模较小的完全子图,以子图为单位构建资源块,以资源块为单位进行资源的分配。实验结果表明,与minStar算法相比,新算法将全局最大通信延迟降至原来的50%。相似文献

12.

联合智能优化和分簇CS的WSNs稀疏数据采集

陈静《计算机工程与应用》2017,53(24):263-270

为提高无线传感器网络（Wireless Sensor Networks,WSNs）数据处理效率和降低网络能耗,提出了一种基于自适应智能优化和分簇压缩感知的WSNs稀疏数据采集方案。首先,建立分簇WSNs稀疏数据通信模型,通过定量分析节点密度与网络数据通信总跳数的关系,给出网络自适应分簇结果,并采用簇内观测矩阵测量数据获取和簇间多跳通信方式完成WSNs压缩感知数据采集;其次,采用StOMP算法进行稀疏信号重构,针对网络节点数据包丢失等链路不可靠情况,引入相关性矩阵变换策略,以降低错误数据传输对数据重构的影响,针对数据稀疏度未知特性和StOMP算法参数配置难的缺陷,将一种新型自适应智能优化（Improved Adaptive Intelligent Optimization algorithm,IAIO）算法应用于CS重构算法中,在理论分析IAIO全局寻优能力的基础上,实现对稀疏数据的可靠重构。最后,仿真结果表明,该方案能够实现稀疏信号的精确重构,而且降低了网络通信总量,提高了网络生存时间。相似文献

13.

多稀疏基分簇压缩感知的WSN数据融合方法

朱路刘媛媛慈白山潘泽中《传感技术学报》2016,29(3):417-422

针对传感器节点采集数据精度与能量消耗的矛盾,提出多稀疏基分簇压缩感知的无线传感器网络WSN（Wireless Sensor Network）数据融合方法。该方法利用改进的阈值对随机部署的传感器节点进行簇首选择继而形成最优簇,簇首采用伯努利随机观测矩阵对簇内节点信号进行线性压缩投影,然后将压缩的信息传送给汇聚节点,减少数据传输即降低通信能耗,从而提高网络的生命周期。根据传感器节点监测信号在有限差分和小波中都具有可压缩特性,汇聚节点在有限差分和小波两个稀疏基的约束下,利用OOMP算法分别对线形压缩投影信息进行重构;并采用最小二乘法融合重构信号,提高数据精度。仿真实验结果表明,多稀疏基分簇压缩感知的WSN数据融合方法在减少数据发送的情况下,能提高整个网络的生命周期,解决采集数据精度与网络生命周期的矛盾。相似文献

14.

基于粒子群优化的大规模传感器网络节点调度策略

刘志刚汪晋宽《控制与决策》2012,27(12):1903-1906

针对资源受限条件下大规模无线传感器网络中协作目标跟踪问题,提出一个基于粒子群优化的节点调度方案.该方案利用高斯粒子滤波算法和方差交叉融合算法获得目标状态预测信息,进而选择下一时刻簇成员节点,并构造了通信能耗的代价函数,利用粒子群优化方法选择最佳的簇头节点,减少了节点调度的计算复杂度,同时保持了较好的跟踪精度.仿真结果验证了所提出方案的有效性. 相似文献

15.

Energy efficient and robust allocation of interdependent tasks on mobile ad hoc computational grid

Sayed Chhattan Shah 《Concurrency and Computation》2015,27(5):1226-1254

A mobile ad hoc computational grid is a distributed computing infrastructure that allows mobile nodes to share computing resources in a mobile ad hoc environment. Compared to traditional distributed systems such as grids and clouds, resource allocation in mobile ad hoc computational grids is not straightforward because of node mobility, limited battery power and an infrastructure‐less network environment. The existing schemes are either based on a decentralized architecture that results in poor allocation decisions or assume independent tasks. This paper presents a scheme that allocates interdependent tasks and aims to reduce task completion time and the amount of energy consumed in transmission of data. This scheme comprises two key algorithms: resource selection and resource allocation. The resource selection algorithm is designed to select nodes that remain connected for a longer period, whereas the resource assignment or allocation algorithm is developed to allocate interdependent tasks to the nodes that are accessible at the minimum transmission power. The scheme is based on a hybrid architecture that results in effective allocation decisions, reduces the communication cost associated with the exchange of control information, and distributes the processing burden among the nodes. The paper also investigates the relationship between the data transfer time and transmission energy consumption and presents a power‐based routing protocol to reduce data transfer costs and transmission energy consumption. Copyright © 2014 John Wiley & Sons, Ltd. 相似文献

16.

工业无线传感器网络攻击源定位任务分配优化算法

孙子文朱颖《信息与控制》2020,(2):225-232

针对工业无线传感器网络中参与攻击源节点定位的任务分配问题,构建和求解多目标优化定位任务分配模型,任务分配模型中设定参考节点组合总能量消耗、距离平均标准偏差目标函数,以及空间约束和剩余能量约束条件;采用循环拥挤排序将非支配排序遗传算法(NSGA-Ⅱ)进行改进后加入基于稀疏度局部搜索的混合优化算法联合求解任务分配模型,将稀疏度最小的解作为稀疏解,再采用极限优化策略在稀疏解周围进行局部搜索使得解拥有更好的分布特性.Matlab仿真结果表明该改进的混合优化算法可以提高算法收敛速度以及降低算法复杂度,在较快的时间内选择出合适的参考节点组合,减少了定位误差,提高了定位精度. 相似文献

17.

一种无线传感器网络的簇数目优化方法 总被引：3，自引：0，他引：3

郝晓辰房艳刘浩然窦晶晶刘彬《传感技术学报》2008,21(8)

针对LEACH算法中无线传感器网络分簇数目的确定问题,提出了一种节点服从泊松分布的情况下最优簇数目的计算方法。该方法利用节点的通信能耗模型,从能耗最小的角度给出了网络的最优簇数目,并证明最优簇数目与监测区域面积、节点数目和泊松分布强度有关,而不是LEACH算法中的固定值,从而为优化网络簇头数提供了一定的依据。仿真表明,在该方法上设计的LEACH算法减少了网络的总能量消耗,有效延长了网络生命周期。相似文献

18.

ParTransgrid: A scalable parallel preprocessing tool for unstructured-grid cell-centered computational fluid dynamics applications

Jian Zhang Jie Liu Naichun Zhou Jing Tang Xie He Jianqiang Chen 《Software》2023,53(1):6-26

The development of a basic scalable preprocessing tool is the key routine to accelerate the entire computational fluid dynamics (CFD) workflow toward the exascale computing era. In this work, a parallel preprocessing tool, called ParTransgrid, is developed to translate the general grid format like CFD General Notation System into an efficient distributed mesh data format for large-scale parallel computing. Through ParTransgrid, a flexible face-based parallel unstructured mesh data structure designed in Hierarchical Data Format can be obtained to support various cell-centered unstructured CFD solvers. The whole parallel preprocessing operations include parallel grid I/O, parallel mesh partition, and parallel mesh migration, which are linked together to resolve the run-time and memory consumption bottlenecks for increasingly large grid size problems. An inverted index search strategy combined with a multi-master-slave communication paradigm is proposed to improve the pairwise face matching efficiency and reduce the communication overhead when constructing the distributed sparse graph in the phase of parallel mesh partition. And we present a simplified owner update rule to fast the procedure of raw partition boundaries migration and the building of shared faces/nodes communication mapping list between new sub-meshes with an order of magnitude of speed-up. Experiment results reveal that ParTransgrid can be easily scaled to billion-level grid CFD applications, the preparation time for parallel computing with hundreds of thousands of cores is reduced to a few minutes. 相似文献

19.

求解最大团问题的并行多层图划分方法

顾军华霍士杰武君艳尹君张素琪《计算机应用》2018,38(12):3425-3432

在当今大数据环境下,针对图中节点的海量性和分析的复杂性对最大团问题的研究在速度和精度上都提出了更高要求的问题,提出求解最大团问题的并行多层图划分方法（PMGP_SMC）。首先,提出一种新的多层图划分（MGP）方法,在保持原有图的团结构不被破坏的情况下对大规模图例划分产生子图,并对规模较大的子图进行多层图划分,进一步缩小子图规模,并且应用GraphX图计算框架实现MGP,形成并行MGP（PMGP）方法;然后,依据划分后的子图规模,减少了惩罚值局部搜索算法（PBLS）的迭代次数,提出基于速度优化的PBLS（SPBLS）来求解划分后的各个子图的最大团;最后,将PMGP和SPBLS相结合形成PMGP_SMC。采用Stanford大规模数据集运行测试,实验结果表明,PMGP相比并行单层图划分方法（PSGP）,求得的最大子图规模能缩小至原来的1/100,平均子图规模能缩小至原来的1/2;PMGP_SMC相比求解最大团问题的PSGP（PSGP_SMC）,总体时间缩短至原来的1/100,并且PMGP_SMC求解最大团的精度和基于极大团枚举求解最大团问题的并行多层图划分方法（PMGP_MCE）一致。PMGP_SMC能够快速精准地求解大规模图例的最大团。相似文献