排序方式: 共有23条查询结果,搜索用时 7 毫秒
1.
2.
若干并行计算模型上的N体问题求解算法 总被引:1,自引:0,他引:1
从在实际中广泛应用的N体问题入手,研究如何在几种实际的并行计算模型(PRAM、APRAM、BSP、LogP、NHBL)上设计具体的并行算法;给出了这些模型上的并行算法的设计模式,分析不同模型上算法的性能,比较各个模型上算法设计风格以及算法性能的差异,并对这些并行计算模型做一个综合的评价。 相似文献
3.
智能手机中各种内置传感器的出现使得用户能采集、分析和挖掘传感器数据中的有用信息。介绍了Android平台上用于采集传感器数据的应用LiveData,它可用于记录用户活动时的数据。针对应用LiveData采集的总量为28万条的传感器数据记录,提取了若干特征属性来识别用户的行为,并进一步分析了不同传感器以及不同数据采集环境对实验结果的影响。 相似文献
4.
5.
6.
7.
一种三维快速傅里叶变换并行算法 总被引:1,自引:0,他引:1
三维快速傅里叶变换在物理计算领域中被广泛地使用.传统并行算法所使用的面划分和块划分方法并不适合稀疏三维向量的傅里叶变换.提出了一种新三维快速傅里叶变换的并行算法,针对稀疏三维向量的傅里叶变换,新算法通过重新调整x,Y,z三个方向的计算顺序,能最大限度地减少计算量以及进程间的通信量,从而减少计算时间,提高并行加速比.详尽的理论分析以及多个高性能计算平台上的实验结果证明:在对稀疏三维向量作傅里叶变换时,新算法优于传统算法. 相似文献
8.
9.
二进制翻译是不同体系结构之间软件移植的重要手段。体系结构和硬件环境上的差别,可以通过二进制翻译系统来弥补,在翻译过程中往往使用多条本地指令模拟一条目标指令,翻译代码规模随之显著增加,从而导致被翻译程序的执行效率下降。寄存器作为处理器和内存交换信息的重要存储部件,寄存器的模拟器方式对于程序的性能有着至关重要的影响。为了提高特定平台翻译后代码的执行效率,提出了在动态二进制翻译机制中使用全部寄存器直接映射方法,详细分析了二进制翻译中的上下文切换原理和寄存器访问范围,为异构平台之间寄存器直接映射提供方法指导。利用QEMU模拟器,把x86架构的8个通用寄存器全部的直接映射到MIPS架构的对应寄存器,在此基础上,进行大量的指令翻译规则的简化。实验数据表明,该方法可以有效简化指令翻译,降低代码膨胀率,使得SPEC CINT 2000测试程序在龙芯CPU上翻译后代码运行时间下降了30%-40%。 相似文献
10.
KD-50-I是第一台采用国产龙芯2F CPU的万亿次高性能计算机.在KD-50-I中,所有的计算单元采用无盘结构,启动时需要通过网络从服务器上下载内核并启动之.为达到该目的,需要修改龙芯的BIOS程序(龙芯使用的BIOS基于一款经过修改的叫做PMON的开源软件)以使之在完成系统初始化工作之后,自动完成下栽内核并启动等工作.为此我们为PMON开发了RTL8169千兆以太网卡驱动程序,并修改了其初始化流程.本文介绍PMON中RTL8169网卡驱动程序的实现情况,利用tftp协议实现网络启动的情况,KD-50-I中的文件系统架构以及KD-50-I上的BLAS库优化情况等. 相似文献