首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 671 毫秒
1.
稀疏矩阵Cholesky分解是求解大规模稀疏线性方程组的核心算法,也是求解过程中最耗时的部分.近年来,一系列并行算法通过图形处理器(GPU)获得了显著的加速比,然而,由于访存的不规则性以及任务间的大量数据依赖关系,稀疏矩阵Cholesky分解算法在GPU上的计算效率很低.文中实现了一种新的基于GPU的稀疏矩阵Cholesky分解算法.在数据组织方面,改进了稀疏矩阵超节点数据结构,通过超节点合并和分块控制计算粒度;在计算调度方面,将稀疏矩阵Cholesky分解过程映射为一系列的数据块任务,并设计了相应的任务生成与调度算法,在满足数据依赖性的前提下提高任务的并行性.实验结果表明,该算法能够显著提高稀疏矩阵Cholesky分解算法在GPU上的实现效率,在单个GPU上获得了相对4核CPU平台2.69~3.88倍的加速比.  相似文献   

2.
求解正则式方程式集合的面向矩阵高斯主元消去法   总被引:1,自引:0,他引:1  
本文在论述利用系数矩阵进行消元变换求解正则表达式方程式集合的高斯消去法的基础上,提出了一种选取系数矩阵中主元素进行消元变换求解正则表达式方程式集合的高斯主元素消去法,并给出易编程的算法。  相似文献   

3.
核矩阵计算是求解支持向量机的关键,已有精确计算方法难以处理大规模的样本数据.为此,研究核矩阵的近似计算方法.首先,借助支持向量机的凸二次约束线性规划表示,给出支持向量机和多核支持向量机的二阶锥规划表示.然后,综合Monte Carlo方法和不完全Cholesky分解方法,提出一个新的核矩阵近似算法KMA-α,该算法首先对核矩阵进行Monte Carlo随机采样,采样后不直接进行奇异值分解,而是应用具有对称置换的不完全Cholesky分解来计算接近最优的低秩近似.以KMA-α输出的近似核矩阵作为支持向量机的输入,可提高支持向量机二阶锥规划求解的效率.进一步,分析了KMA-α的算法复杂性,证明了KMA-α的近似误差界定理.最后,通过标准数据集上的实验,验证了KMA-α的合理性和计算效率.理论分析与实验结果表明,KMA-α是一合理、有效的核矩阵近似算法.  相似文献   

4.
李鹏  刘力军  黄永东 《计算机科学》2021,48(z1):220-225
经典的谱聚类算法包含两个步骤.(1)谱嵌入过程:求解Laplacian矩阵的特征值分解,得到分类指示矩阵的连续松弛解.(2)后处理过程:对谱嵌入连续松弛矩阵应用k-means或者谱旋转,得到最终的二值指示矩阵.由于有用信息的丢失,这种单独求解步骤不能保证最佳聚类结果.同时,谱聚类算法在处理大规模数据集时,存在聚类精度低、数据相似度矩阵存储开销大和Laplacian矩阵特征值分解计算复杂度高的问题.已有的联合谱聚类算法使用标准正交矩阵逼近非标准正交簇指示矩阵,这会导致较大的逼近误差.为了克服这一缺点,提出用一个改进的标准正交簇指示矩阵代替非正交指示矩阵,得到一个新的联合谱嵌入和谱旋转的谱聚类算法.因为两个标准正交矩阵更容易最小化,所以提出的算法可以取得更好的性能.进一步通过地标点方法对原始数据集进行稀疏特征表示,提出一种基于地标表示的联合谱嵌入和谱旋转算法(LJSESR),解决了大规模数据谱聚类的高效求解问题.实验结果表明,提出的LJSESR算法具有可行性和有效性.  相似文献   

5.
重点研究了极限学习机ELM对行为识别检测的效果。针对在线学习和行为分类上存在计算复杂性和时间消耗大的问题,提出了一种新的行为识别学习算法(ELM-Cholesky)。该算法首先引入了基于Cholesky分解求ELM的方法,接着依据在线学习期间核函数矩阵的更新特点,将分块矩阵Cholesky分解算法用于ELM的在线求解,使三角因子矩阵实现在线更新,从而得出一种新的ELM-Cholesky在线学习算法。新算法充分利用了历史训练数据,降低了计算的复杂性,提高了行为识别的准确率。最后,在基准数据库上采用该算法进行了大量实验,实验结果表明了这种在线学习算法的有效性。  相似文献   

6.
提出了应用图形处理器(GPU)加速求解线性方程组的高斯消元法,用二维四通道纹理表示系数矩阵与常数向量构成的矩阵,在该矩阵内完成归一化、消元等操作.提出了新的纹理缩减算法,该算法不要求纹理的边长是2的幂,把该纹理算法应用于高斯消元法的列主元搜索和确定主元行号.根据这些算法,使用OpenGL着色语言编程,用图形处理器实现加速求解线性方程组的高斯消元法,运算时间与基于CPU的算法比较,随着方程组未知量数量增多,基于GPU的算法具有较快的运算速度,证实图形处理器能加速线性方程组的求解.  相似文献   

7.
陈恳  熊哲浩  魏艺君  廖嘉文 《计算机仿真》2021,38(9):310-314,338
求解变系数方程的高斯消元法与高斯-约当消元法计算原理类似、问题相近,但前者计算速度高于后者.提出分段对称反向高斯-约当消元法,其中包括根据系数矩阵结构特点构成特殊增广阵,以展示和应用元素的变化规律,并分段对上下三角元素消元以大大提高计算效率.对矩阵下三角元素正向消元及对称计算可简化所有下三角元素计算,而对上三角元素反向消元可再省略所有上三角元素计算,而取倒后的对角元素作为规格化因子可大大减少除法计算.根据单位矩阵结构特点,对其规格化或对系数矩阵上下三角元素消元时均仅计算部分对角元素和下三角元素可进一步提高计算效率.所有元素均用四角规则计算而无需计算公式以简化计算和编程.新方法大大减少了高斯-约当消元法中元素的计算,且原理简单、易于编程,可快速求解各种变系数方程,还可利用元素对称性求解常系数的节点阻抗矩阵.与高斯消元法和高斯-约当消元法相比,新方法计算速度大大提高.  相似文献   

8.
采用分布估计算法计算AHP判断矩阵排序权重   总被引:1,自引:0,他引:1       下载免费PDF全文
判断矩阵排序权重计算及其一致性检验可以归结为一个使一致性指标最小化的非线性、变量耦合的优化问题。提出一个利用基于序贯重点采样粒子滤波和Cholesky分解的分布估计算法计算排序权重的算法,该算法采用的概率模型是多峰的并考虑了变量之间相关性。文中对判断矩阵排序权重计算及一致性检验、基于序贯重点采样粒子滤波和Cholesky分解的分布估计算法进行了介绍,描述了排序权重计算及一致性检验算法,最后给出实验数据及其分析。实验结果验证了算法的有效性,并具有很高的精度和稳定性。  相似文献   

9.
在阵列信号抗干扰算法中,常常需要求解协方差矩阵的逆矩阵。Cholesky分解利用了协方差矩阵的厄米特(Hermitian)正定的特性,大大简化了矩阵求逆运算的计算量。论文介绍了Cholesky分解数学原理,并提出了一种适合FPGA实现的结构。基于浮点数的算法实现相比传统的定点数,大大提高了结果的精度。由于Cholesky分解需要涉及浮点数的开方运算,论文引入了平方根倒数法来提高开方运算的速度。通过仿真与实测,选取了最优的资源与速度的实现方案。  相似文献   

10.
针对大型实对称正定矩阵的Cholesky分解问题,给出其在图形处理器(GPU)上的具体实现。详细分析了Volkov计算Cholesky分解的混合并行算法,并在此基础上依据自身计算机的CPU以及GPU的计算性能,给出一种更为合理的三阶段混合调度方案,进一步减少CPU的空闲时间以及避免GPU空闲情况的出现。数值实验表明,当矩阵阶数超过7000时,新的混合调度算法相比标准的MKL算法获得了超过5倍的加速比,同时对比原Volkov混合算法获得了显著的性能提升。  相似文献   

11.
俞经虎  竺长安  邱欲明  程刚  张屹  李川奇 《机器人》2003,25(Z1):610-613
仿生机器鱼的研究受到各国越来越多的研究工作者的重视,并取得了一定的成果.本文着重研究了仿生机器鱼的尾鳍的动力学并建立了仿生机器鱼的运动模型,并对该模型进行了计算机仿真,研究探索了仿生机器鱼的前进速度与尾鳍摆角、摆动频率、摆动幅度之间的关系.  相似文献   

12.
多种燃料锅炉的运行优化是钢铁联合企业节约能源的一个主要方法,但是这种锅炉的效率曲线的辨识却是一个复杂而困难的非线性最小二乘问题。借鉴大系统递阶算法的思想,本文提出了一种新的两级递阶辨识的算法。这种算法通过预估关联量,将非线性最小二乘问题转化为两级线性最小二乘问题。实验的结果证明:这种算法是一种有效的算法。  相似文献   

13.
多台电轴系统稳定性区域之扩大   总被引:1,自引:0,他引:1  
刘永清在[1]、[2]中研究了疏松桂提出的多台电轴系统的稳定性,本文应用标量函数分解法,从如何寻求尽可能大的稳定域的观点出发,研究了电力拖动自动控制系统中带平衡机的n台电轴系统的稳定性,扩大了参数稳定性区域,并给出渐近稳定性区域估计式。  相似文献   

14.
智能优化策略的比较   总被引:2,自引:0,他引:2  
智能优化是从诸多新兴学科衍生出来的前沿科学,本文研究了智能优化的策略,对计算智能策略进行了分析比较,并举出了在工程实践中用这些策略进行智能优化的实例,从中得出有意义的结论。  相似文献   

15.
The area perception of incomplete (interpolated) geometric figures is studied. The obtained data are discussed in order to compare them with the results of our previous experiments where complete figures were studied. The results of the present experiment support the validity of the model of area perception that is based on the concept of image function. The different contributions of the perceptual processes as well as of the cognitive processes to the area estimation are discussed.  相似文献   

16.
商陆军 《计算机学报》1992,15(12):920-926
文献[1]提出了一种新的刻划并发行为的方法.本文继续讨论这种方法在面向对象的程序设计中是如何解决并发代码在继承过程中的冲突问题的.  相似文献   

17.
文中提出了一个基于多边形逼近和凸包球取的人体三围特征计算方法。首先给出了一个具有确定性的高效的多边形逼年算法,运用该算法对人体横截面边界进行特征化处理,再通过特征识别抽取人体三围的特征多边形,最后通过计算凸包的方法获取人体三围特征值。文中提出的方法已运用于一个综合化的服装CAD系统中。  相似文献   

18.
计算机仿真系统的可信度评估   总被引:6,自引:0,他引:6  
肖斌 《计算机仿真》2000,17(4):18-20
相似理论是计算机仿真的基础,它在建立仿真模型、仿真可信性评估等方面都有很好的指导作用,在文中分析相似理论中的序结构定律的基础上,将序结构定律运用于计算机仿真系统的相似评定中,并给出了具体的算法。对如何评估仿真系统的相似度问题,在理论上作了一定的研究和探讨。  相似文献   

19.
本文给出了表的等价性判定的一些结果:三元可满足性问题,表达式的NP完全性,表的NP完全性,还给出了函数依赖对表的影响,强等价性的复杂性的一些讨论。为对表的进一步研究屯指出了方向。  相似文献   

20.
独立边界自增强方法   总被引:3,自引:0,他引:3  
提出了独立边界的自增强算法.使用反复随机搜索获得各种可能的独立边界轨迹;使 用搜索轨迹的自增强代替过去的固定点的领域增强方法;采用搜索轨迹的积累技术代替过去的 迭代操作.实验证明:该方法克服了过去的方法对噪声和局部错误极度敏感的缺点,能够在进行 边缘增强的同时有效地抑制噪声.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号