首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
为分布内存系统开发的并行编译器碰到的第一个问题就是如何分解一个应用程序中的数据.由于访问非本地节点上数据的代价是昂贵的,所以数据分解必须仔细考虑.尽管数据分解的定义已被提出,但是文献并没有给出相应的算法.本文介绍了在一个已被证明且功能强大的数学模型下如何产生数据分解代码的算法,并在SUIF(Stanford university intermediate format)系统中的Paraguin编译器上得到实现.  相似文献   

2.
沈亚楠  姚远  张平  赵荣彩  罗向阳 《计算机工程》2006,32(11):114-115,132
数据分解对消息传递并行机下的并行编译器取得高性能至关重要。根据编译器自动得出的数据分解(映射数据到处理机)信息,C语言版本的发送/接收消息循环嵌套可产生出来,从而在处理机之间实现分布数据。不仅一个已被证明且功能强大的数学模型用于产生数据分解代码,而且一个形式化的算法及其实现也已给出。初步实验结果显示该算法能显著提高性能。  相似文献   

3.
一种增量PCA算法及其在人脸识别中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
主成分分析(PCA)是模式识别领域一种重要的方法,现在已被广泛地应用于人脸识别算法中,但基于PCA人脸识别系统在应用中面临着一个重要障碍:增量学习问题。针对这个问题,提出了一种适用于成批增量数据的IPCA算法,该算法在原始PCA分解的基础上,利用空间投影变换,使得可以在一个低维空间求解整体PCA,从而降低了求解的复杂度,在此基础上对该增量算法进行了核化,并在ORL人脸数据库上验证了算法的有效性。  相似文献   

4.
:体数据的小波表示及其在体绘制中的应用是近年来的一个研究热点。周期化技术是实现体数据小波分解的一个关键技术 ,但有关文献既未详细讨论也未给出技术细节。鉴于基数B样条小波在体绘制中的重要性 ,本文根据基数B样条小波分解算法及周期小波的概念 ,推导了周期B样条小波分解算法 ,并将该算法应用于体数据的多分辨表示。  相似文献   

5.
低秩分解可以有效地应用于运动检索中,然而目前有些方法是针对每个运动单独分解,在分解算法层次上忽略了不同运动之间的相关性.为此,提出一种在数据库上的低秩分解算法,在数据库中所有运动共享一组基,并加入稀疏约束得到运动数据的有效表示;提出一种合理的运动数据构成方式,得到优化目标方程,并给出相应的优化解法,证明了其收敛性.采用文中的分解算法,每个运动被低秩表示成一个基和一个时序向量,由于不同的运动共享一组基,因此该算法具有更好的聚类效果,即相似运动倾向于选择相同的基.实验结果表明,文中算法在运动检索应用上是有效的,并讨论了不同参数设置对检索结果的影响.  相似文献   

6.
现有的非负矩阵分解方法既忽略数据的非局部结构,又难以有效应对噪声和野值点。为了解决上述问题,提出一种新的用于聚类的鲁棒结构正则化非负矩阵分解算法。所提出的算法分别构建一个近邻图和一个最大熵图描述数据的局部结构和非局部结构,并使用L2,1范数代价函数尝试解决噪声问题,从而学习到鲁棒具有判别力的表征。给出一个最优的迭代算法求解两个非负因子,该优化算法的收敛性已被理论和实验证明。在七个图像数据集上的聚类实验结果表明,所提出的算法在无噪声和有噪声情况下聚类均优于其他主流方法。  相似文献   

7.
随着技术的发展,数据往往具有来自不同源的多种形式,多视角聚类算法旨在利用不同源中的互补信息进行聚类。虽然目前多视角聚类算法已在各个领域取得较大发展和成功应用,但是多视角聚类算法仍然面临许多重要挑战,其中一个就是当多个视角的样本存在缺失时,如何充分挖掘数据信息以减少缺失样本带来的负面影响。针对此挑战,提出一种基于核诱导的不完整多视角聚类算法(KIMV)。该方法利用核方法和非负矩阵分解技术在核希尔伯特空间中对所有视角学习一个最优的共性矩阵,并通过视角自适应加权机制和图拉普拉斯正则化提高算法性能。在五个多视角数据集上的实验有效验证了KIMV的上述优势。  相似文献   

8.
传统推荐系统研究很少利用评论数据来提高推荐性能。评论数据富含用户对物品的评价观点,有助于建立用户间或物品间的关联。针对如何利用评论数据改善推荐效果,提出了一种基于评论的隐式社交矩阵分解模型。模型利用评论间的相似性构建用户间和物品间的隐式社交关系,并将该隐式关系集成到社交推荐框架中,改进了传统矩阵分解推荐模型。实验表明,基于评论数据的隐式社交关系在多个数据集上使传统矩阵分解算法的RMSE降低了约3%。特别是当系统面临用户冷启动困境时,即只有少量用户评分数据可被收集到时,推荐提升效果更为显著。这表明丰富的评论数据能够被转化为改善推荐系统的有用知识。  相似文献   

9.
武昱  闫光辉  王雅斐  马青青  刘宇轩 《计算机科学》2018,45(11):298-303, 317
随着高维数据的涌现,张量和张量分解方法在数据分析领域中受到了广泛关注。然而,张量数据的高维度和稀疏特性,导致算法的复杂度较高, 阻碍了张量分解算法在实际中的应用。许多学者通过引入并行计算来提升张量分解算法的计算效率。在现有研究的基础上,给出一种简化计算Khatri-Rao乘积的GPU并行CP张量分解算法,称为ParSCP-ALS。在模拟数据集和真实数据集上的实验结果显示, 相比现有并行算法,文中设计的ParSCP-ALS算法能有效提高CP张量分解的计算效率,其中在Movielens数据集上 的计算时间减少了约58%。  相似文献   

10.
QR分解作为一个基本计算模块,广泛应用在图像处理、信号处理、通信工程等众多领域.传统的并行QR分解算法只能挖掘计算过程中的数据级并行.在分析快速Givens Rotation分解特征的基础上,提出了一种多层次并行算法,能够同时挖掘计算过程中的任务级并行和数据级并行,非常适合于以图形处理器(GPU)为代表的大规模并行处理器.同时,采用GPU的并行QR分解算法可以作为基本运算模块被GPU平台上的众多应用程序直接调用.实验结果显示,与CPU平台上使用OpenMP实现的算法相比,基于GPU的多层次并行算法能够获得5倍以上的性能提升,而调用QR分解模块的奇异值分解(SVD)应用可以获得3倍以上的性能提升.  相似文献   

11.
在并行优化编译器的并行识别过程中,许多串行代码无法找到全局一致的分解结果,数据重分布无可避免,有必要寻找一种有效的方法求解计算和数据的动态分解。该文研究了单个嵌套循环计算与数据分解算法以及分解结果表示方法,提出一种在多个嵌套循环间求解数据线性一致分布的动态分解算法,结合程序的结构分析和程序的控制流信息,用于通用串行代码的并行分解过程,可以同时给出串行代码的计算划分和数据分布结果。  相似文献   

12.
对于分布内存体系结构的并行计算机而言,如何对计算和数据进行合理划分以增加数据本地化减少处理器间的通信是提高其并行性能的关键,但在数据划分过程中,重分布通信有时不可避免,如何进行合理的数据和计算划分以减少通信并最大限度的利用程序的并行性是并行编译中的一个重要问题。该文主要讨论了一种支持数据重分布的自动进行计算和数据划分的算法。  相似文献   

13.
多传感器数据融合技术已经被广泛应用在多个领域,小波多尺度分解对数据的分析具有独特的优点,小波基的选择对数据融合结果也起着关键的作用.提出一种新的基于多个小波基的数据融合算法,先对含有噪声的传感器信号进行多个不同小波基的多尺度分解,然后对相同小波基分解的信号在多尺度上实施加权数据融合算法,之后进行不同小波基的逆变换得到的重构信号,最后将基于不同小波基的重构信号做最终的融合.实验结果表明:数据融合技术可以从多个方面多个层面以及多种融合原则来考虑,从而融合众多的因素得到最优的结果.  相似文献   

14.
To achieve scalable parallel performance in molecular dynamics simulations, we have modeled and implemented several dynamic spatial domain decomposition algorithms. The modeling is based upon the bulk synchronous parallel architecture model (BSP), which describes supersteps of computation, communication, and synchronization. Using this model, we have developed prototypes that explore the differing costs of several spatial decomposition algorithms and then use this data to drive implementation of our molecular dynamics simulator,Sigma. The parallel implementation is not bound to the limitations of the BSP model, allowing us to extend the spatial decomposition algorithm. For an initial decomposition, we use one of the successful decomposition strategies from the BSP study and then subsequently use performance data to adjust the decomposition, dynamically improving the load balance. The motivating reason to use historical performance data is that the computation to predict a better decomposition increases in cost with the quality of prediction, while the measurement of past work often has hardware support, requiring only a slight amount of work to modify the decomposition for future simulation steps. In this paper, we present our adaptive spatial decomposition algorithms, the results of modeling them with the BSP, the enhanced spatial decomposition algorithm, and its performance results on computers available locally and at the national supercomputer centers.  相似文献   

15.
丁锐  赵荣彩  韩林 《软件学报》2013,24(12):2843-2858
划分是一种自动分配计算和数据到各个处理器的编译技术,是分布存储结构下并行编译的核心问题.以往的划分研究较少从生命期的角度考虑数据分解问题,分解在数组的不同生命期中不一致时会产生冗余通信.为解决上述问题,提出了一种数据分解算法,通过定义-引用图来表示数组的数据流信息,并使用分解映射表为数组不同的生命期建立各自的数据分解.对矩阵求逆等9 个实际用例的实验结果表明,与以往不区分生命期的划分研究相比,使用所提算法能够在寻找数据分解时对并行收益做出更准确的评估,减少了通信冗余,从而提升了自动生成的并行代码的加速比.  相似文献   

16.
丁锐  赵荣彩  韩林 《计算机科学》2012,39(3):290-294
计算和数据自动划分是并行化编译中一种自动分配计算和数据到各个处理机的优化技术,划分的结果直接影响程序并行的性能。数组是划分处理的主要对象之一,一些数组分布后的收益不高,但带来的并行约束却能对其它数组的划分产生干扰,导致大量数据重分布通信的产生。现有的划分算法中没有约定数组分布的优先次序,因此无法限制这些数组并行约束的传播,降低了优化编译器后端自动生成并行代码的性能。提出了一种基于主导值的计算和数据自动划分算法:将划分过程中数组对程序并行性的影响量化为主导值,并依据主导值的大小约定数组分布的优先次序,限制干扰数组并行约束的传播速度,提高划分结果的合理性。实验结果表明,算法能够获得良好的划分效果。  相似文献   

17.
对于高性能并行计算机而言,如何找到一种好的计算和数据划分,对数据和计算进行合理划分,增加数据本地化来减少处理器间的通信是提高其并行性能的关键。该文讨论了一种线性的自动进行无数据重组的计算和数据划分算法。  相似文献   

18.
整数提升小波多相矩阵分解系数不唯一,选取方法多样,计算量大。首先采用滤波器迭代次数选取算法,按照输入的信噪比(SNR)比例求出优化迭代次数;然后以非线性迭代比较算法为判定准则,结合求出的优化迭代次数,得到满足参数要求的优化分解系数。迭代次数是依据待测数据求得的,因此优化分解系数对该数据取得较好的处理效果,满足多相矩阵分解系数选取的要求。迭代比较算法满足收敛特性,通过比较滤波器的冲击和阶跃响应是否满足设定的误差限,可减少迭代运算次数,快速准确地选取优化小波系数。通过实验分析可知,该快速提取算法能有效满足数据处理的要求,减少待测数据处理的计算量,提高数据处理的效率。  相似文献   

19.
为了实现数据资源广域分布的电网系统分布式分解协调计算,提出了面向服务架构的电力分布式计算总线(EDCB)协调机制。采用主从分层分区方法,把互联的电力网络划分成主区和从区,在分区环境下分析电力分布式计算的数据需求、计算环境和计算结构,设计电力分布式计算总线模型,进行分布式分解协调计算。通过Ward等值方法,把电网数据转换成数据量较小的等值数据,并利用SOA技术实现分布式计算总线。  相似文献   

20.
对于分布内存体系结构的并行计算机而言,如何对计算和数据进行合理划分以增加数据本地化减少处理器间的通信是提高其并行性能的关键。本文主要讨论了一种自动实现无数据重组的静态计算和数据划分算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号