期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	28篇
免费	12篇
国内免费	2篇

专业分类

综合类	2篇
无线电	1篇
自动化技术	39篇

出版年

2021年	2篇
2019年	1篇
2018年	1篇
2017年	3篇
2016年	1篇
2014年	3篇
2013年	5篇
2012年	2篇
2011年	4篇
2010年	2篇
2009年	6篇
2007年	4篇
2006年	1篇
2005年	1篇
2004年	1篇
2003年	2篇
2001年	1篇
2000年	1篇
1999年	1篇

排序方式： 共有42条查询结果，搜索用时 0 毫秒

[首页] « 上一页 [1] 2 [3] [4] [5] 下一页 » 末页»

11.

Cell处理器上软件缓存的设计与实现 总被引：1，自引：0，他引：1

下载免费PDF全文

孙守航杨灿群《计算机工程》2011,37(2):45-47

在 Cell异构多核处理器上,并行程序对不规则共享数据的访问延迟较大,共享数据的一致性维护困难。为解决上述问题,提出一种基于扩充Location Consistency存储模型一致性协议的软件缓存。测试结果表明,该软件缓存能够缩短近40%的共享数据访问时间,有效提高并行程序的执行效率。相似文献

12.

Programming for scientific computing on peta-scale heterogeneous parallel systems

杨灿群吴强唐滔王锋薛京灵《中南工业大学学报(英文版)》2013,20(5):1189-1203

相似文献

13.

GCC后端中四路双精度短向量寄存器的实现

李春江杜云飞倪晓强王永文杨灿群《计算机科学》2012,39(9):292-295

设计和实现一个新的产品化的编译器通常需要几年时间。基于已有的编译器进行修改和扩展,是研发面向新体系结构的编译器的主要途径。GNU编译器集合(GCC)支持多种高级语言和多种目标处理器平台、文档及源代码开放等。基于GCC的Sparc后端,实现了支持四路双精度SIMD指令的四路双精度短向量寄存器的描述。在此过程中,定义了新的目标机,扩充了一类向量模式,定义了一类新的寄存器约束,实现了四路双精度寄存器的描述,定义了四路双精度SIMD指令的机器描述。对于面向此类SIMD指令的内嵌函数,GCC编译器能够正确使用该类向量寄存器来生成对应的SIMD指令。相似文献

14.

80位浮点运算的编译实现与优化

杨灿群杨学军易会战李春江《计算机工程与科学》2009,31(1)

本文介绍了80位浮点运算的编译实现技术,在IA-64平台上针对一套科学计算测试程序进行了性能瓶颈分析。利用IA-64体系结构特点,改进和实现了用户定义函数的自动内联、高级循环变换、数据预取、80位浮点数学库函数内联扩展四种编译优化。测试结果表明,这些优化手段显著提高了80位浮点运算的串行性能和并行性能。相似文献

15.

Cell处理器上的软件Cache研究

下载免费PDF全文

杨灿群王锋杜云飞《计算机工程与科学》2011,33(2):46

为了提高Cell处理器对共享数据访问的性能,本文设计并实现了一个能够支持释放一致性存储模型的软件Cache。实验结果表明,该软件Cache能够大大缩短SPE对系统主存中共享数据的访问时间开销,提高Cell处理器上OpenMP程序的并行性能。相似文献

16.

GCC中内嵌函数实现剖析

李春江杜云飞易会战杨灿群《计算机科学》2012,39(106):357-359,379

GNU编译器集合(GCC)具有支持多种高级语言和多种目标处理器平台、文档及源代码开放等的特点,在工业界和学术界被广泛使用。GCC支持非常多的内嵌函数,内嵌函数是GCC编译器中非常重要的一部分实现。首先分析GCC中多种内嵌函数的目的和作用;之后结合实际工作,以使用向量扩展指令的内嵌函数实现为例,剖析了平台相关的内嵌函数的实现过程。本工作对深入理解C}CC编译器中的内嵌函数实现机制,对基于C}CC的研究和开发有较强的参考意义。相似文献

17.

多核/众核平台上推荐算法的实现与性能评估

陈静方建滨唐滔杨灿群《计算机科学》2017,44(10):71-74

用OpenCL语言标准设计并实现了推荐系统领域的两种经典算法:交替最小二乘法(Alternating Least Squares,ALS)与循环坐标下降法(Cyclic Coordinate Descent,CCD)。将其应用到CPU,GPU,MIC多核与众核平台上,探索了在该平台上影响算法性能的因子:潜在特征维数与线程个数。同时,将OpenCL实现的两种算法与CUDA和OpenMP的实现进行比较,得出了一系列结论。在同等条件下,与ALS算法相比,CCD算法的精度更高,收敛速度更快且更稳定,但所耗时间更长。ALS和CCD算法基于OpenCL的实现性能不亚于CUDA(CCD 上加速比为1.03x,ALS上加速比为1.2x)和OpenMP的实现(CCD与ALS上加速比大约为1.6~1.7x),并且两种算法在CPU平台上的性能均比GPU与MIC好。相似文献

18.

OpenMC： Towards Simplifying Programming for TianHe Supercomputers

下载免费PDF全文

廖湘科杨灿群唐滔易会战王锋吴强薛京灵《计算机科学技术学报》2014,(3):532-546

Modern petascale and future exascale systems are massively heterogeneous architectures. Developing productive intra-node programming models is crucial toward addressing their programming challenge. We introduce a directive- based intra-node programming model, OpenMC, and show that this new model can achieve ease of programming, high performance, and the degree of portability desired for heterogeneous nodes, especially those in TianHe supercomputers. While existing models are geared towards oifloading computations to accelerators （typically one）, OpenMC alms to more uniformly and adequately exploit the potential offered by multiple CPUs and accelerators in a compute node. OpenMC achieves this by providing a unified abstraction of hardware resources as workers and facilitating the exploitation of asynchronous task parallelism on the workers. We present an overview of OpenMC, a prototyping implementation, and results from some initial comparisons with OpenMP and hand-written code in developing six applications on two types of nodes from TianHe supercomputers. 相似文献

19.

基于GCC实现飞腾处理器向量处理单元的编译器后端

李春江杜云飞倪晓强王永文杨灿群《计算机科学》2013,40(12):19-22

编译器后端是针对特定目标机器的编译器实现,不同的指令集体系结构需要实现不同的编译器后端。面向飞腾处理器中向量处理单元(FT-VPU)的体系结构和指令集,基于GCC编译器实现了编译器后端,使GCC能够正确编译面向FT-VPU的SIMD指令的内嵌函数。从四路双精度SIMD指令的机器描述出发,总结了在GCC后端所做的实现工作。其对基于GCC编译器实现面向特定目标机器的编译器后端有较大的参考价值。相似文献

20.

一种基于分类器投票的车牌定位方法

王钦民李宽杨灿群《计算机工程与科学》2016,38(6):1200-1206

为解决类似车牌和失真车牌的定位难题,提出一种基于分类器投票的车牌定位方法。方法从两个方面提升车牌定位精度:首先,针对类似车牌和失真车牌的图像特点,提出两种新的车牌图像描述子,针对性地提升两类车牌的定位效果;其次,使用多种描述子分别训练SVM分类器,采用分类器投票融合的方式决定最终分类结果,进一步提升定位准确度。实验结果表明:(1)相比传统的小波和LBP车牌图像描述子,所提算法有效地提高了失真车牌的定位精度,降低了类似车牌的识别错误率。(2)构建的投票融合分类器方法使车牌图像的分类错误率从单个描述子最优的3.05%下降到了0.8%。相似文献

[首页] « 上一页 [1] 2 [3] [4] [5] 下一页 » 末页»