共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于GPU的稀疏矩阵与向量相乘的性能优化、数据从CPU端传到GPU端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和CUSPARSE函数库中的cusparseDcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用CUBLAS库和CUSPARSE库实现的算法稍具优势,与CPU端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。 相似文献
3.
不完全Cholesky分解预条件共轭梯度(incomplete Cholesky factorization preconditioned conjugate gradient, ICCG)法是求解大规模稀疏对称正定线性方程组的有效方法.然而ICCG法要求在每次迭代中求解2个稀疏三角方程组,稀疏三角方程组求解固有的串行性成为了ICCG法在GPU上并行求解的瓶颈.针对稀疏三角方程组求解,给出了一种利用GPU加速的有效方法.为了增加稀疏三角方程组求解在GPU上的多线程并行性,提出了对不完全Cholesky分解产生的稀疏三角矩阵进行分层调度(level scheduling)的方法.为了进一步提高稀疏三角方程组求解的并行性能,提出了在分层调度前通过近似最小度(approximate minimum degree, AMD)算法对系数矩阵进行重排序、在分层调度后对稀疏三角矩阵进行层排序的方法,降低了分层调度过程中产生的层数,优化了稀疏三角方程组求解的GPU内存访问模式.数值实验表明,与利用NVIDIA CUSPARSE实现的ICCG法相比,采用上述方法性能可以获得平均1倍以上的提升. 相似文献
4.
本文基于修正的共轭梯度公式,提出了一个具有充分下降性的共轭梯度算法,该算法不需要线搜索,其步长由固定的公式给出.某种程度上,该算法利用了目标函数的二次信息,对目标函数的(近似)二次模型采取了精确线搜索,每步都只需要计算一次梯度值,特别适合大规模优化计算.本文还给出了该算法的全局收敛性分析,并得到强收敛结果.数值实验表明这种算法是很有应用前景的. 相似文献
5.
自适应解卷积与二次型共轭梯度算法 总被引:1,自引:0,他引:1
提出一种新的解卷积算法,它是将卷积运算关系yi=hi*fi转换为解矩阵方程Y=AH.运算这个矩阵方程可实现卷积与解卷积。文中也给出解矩阵方程的优化算法、QCG(二次型共轭梯度)算法。计算机模拟表明,新算法具有精度高、速度快、数据短和计算稳定等优点. 相似文献
6.
求解支撑向量机的二次规划有不同的变形.对于线性问题,从一个变形出发,利用Lagrangian对偶技巧,将特征空间的高维二次规划问题转化为输入空间的低维无约束、可微凸的对偶规划.针对目标函数的分片二次特征,结合快速精确的一维搜索技术,提出共轭梯度型支撑向量机来求解该问题.利用Cholesky分解或非完全(incomplete)Cholesky分解方法分解核矩阵,在算法复杂度增加很少的条件下可实现基于核函数的非线性分类.该算法可以在普通计算机上快速求解上百万规模的线性训练问题和较大规模的非线性训练问题.大量数据实验和复杂度分析表明,该算法与同类算法如ASVM、LSVM相比是有效的. 相似文献
7.
《计算机工程与科学》2017,(10):1958-1965
针对基本蛙跳算法在处理复杂函数优化问题时求解精度低且易陷入局部最优的缺点,提出了一种嵌入共轭梯度法的混合蛙跳算法。该算法在基本蛙跳算法划分模因组的基础上引入共轭梯度法,由于基本蛙跳算法模因组的划分规则,使得排在最后的青蛙子群个体位置较差,严重影响着整个群体的寻优速度,因而选取排列在后面的一部分模因组使用共轭梯度法进行求解,这使得算法在进化中后期易跳出局部最优,提高了算法的收敛精度。所得混合蛙跳算法有效结合了基本蛙跳算法较强的全局搜索能力和共轭梯度法快速精确的局部搜索能力。数值实验结果表明,所提出的改进蛙跳算法较基本蛙跳算法具有更高的收敛精度,避免了陷入局部最优的缺点,且优化结果更加稳定。 相似文献
8.
9.
一类修正的DY共轭梯度法及其全局收敛性 总被引:2,自引:0,他引:2
本文提出了一类求解无约束优化问题的修正DY共轭梯度法.算法采用新的迭代格式,每步迭代都可自行产生一个充分下降方向.采用Wolfe线搜索时,证明了全局收敛性.数值实验结果验证了算法是有效的. 相似文献
10.
快速准确地对电网信号的谐波进行检测与估计,对提高现代电力系统的工作效率有重要意义。传统的快速傅立叶变换(FFT)方法速度较快,但精度不高。近年来,很多学者将谐波估计归结为一个线性极小二乘问题,并用奇异值分解(SVD)算法求解。这类方法虽然提高了精度,但奇异值分解的计算量较大,尤其大规模问题,不能达到"即时"的要求。文中基于共轭梯度分解(CGD)方法对电网中的信号进行谐波估计,不仅降低了SVD算法的计算量,同时提高了FFT的精度,并能应用到严重畸变的定期信号的估计上。初步实验结果验证了该方法的有效性。 相似文献
11.
关于堆排序的一种新型算法 总被引:5,自引:0,他引:5
In this paper, a new algorithm of heapsort, called second orderheapsort, is suggested. It is proved that the average time complexityof the algorithm is O(n 2 n) and the speed of the algorithm,which has used optimum data processing method, is heightened 180%. 相似文献
12.
一类新型计算机控制算法:预测控制算法 总被引:9,自引:0,他引:9
建立在预测模型基础上、以快速数字计算机为手段的预测控制算法,是七十年代以来工业过程控制中的一类新型算法。本文综述了这类预测控制算法产生的背景、基本原理及其研究的主要问题,对这类算法的实际应用作出了评价,并展望了今后的发展方向。 相似文献
13.
一种基于Hermite插值的离散点构造曲面的新算法 总被引:9,自引:0,他引:9
提出了一种通过矩形作用域划分、迭加来构造曲面的新思想。在此基础之上,对实际测量的三维离散点进行了特殊的Hermite插值构造曲面,并通过重叠的矩形作用域的迭加以形成一张新曲面。文中证明了这种方法的完备性,并严格证明了所构造曲面对实际测量点的依赖性,而不会因为迭加出现奇异点。 相似文献
14.
15.
本文提出一和中运用人工神经网络结合正交换变换的方法,即通过正交变换滤除噪声,通过交叉验证确定网络最佳构型,以充分发挥正交变换和神经网络各自的长处,即免了同过拟合,实现更准确的预后。 相似文献
16.
庹军民 《计算机应用与软件》2010,27(6):230-232,262
定义了Pareto最优解及与其相关的一些概念,引入了被广泛应用的改进的单目标PSO(Particle Swarm Optimization)算法.在此基础上提出了MOPSO算法,用改进的Pareto最优解概念排挤不满足约束的解,还采取一种新的寻找全局最优粒子策略.为了方便评估算法的性能,提出三个比较规则:AD、SP和ER.求解三个复杂的测试问题的结果显示,MOPSO能求出数量充足的、分布均匀的Pareto最优解. 相似文献
17.
一种新的机器人机构距离误差模型及补偿算法 总被引:3,自引:0,他引:3
在标定机器人绝对位置精度和实施误差综合补偿过程中,必然涉及到测量系统坐标系与机器人基础坐标系间的变换.由于这一变换很难精确测定.从而给机器人绝对位置精度标定与误差补偿带来了难以克服的困难.本文首次提出了一种新的机器人机构距离误差计算模型及补偿算法,论证了距离误差同样可以作为机器人绝对位置精度的一种度量.利用该模型和算法对机器人进行误差分析和实施误差综合补偿,可避开上述测量系统与机器人系统间的坐标变换,从而简化了机器人绝对位置精度的标定过程,为提高机器人的绝对位置精度开辟了一个新的简便的途径. 相似文献
18.
19.
基于纹理分析的仪表读数区域定位新方法 总被引:1,自引:0,他引:1
仪表读数自动识别的关键是准确检测出指针在刻度区域的位置,因此仪表盘上刻度区域的准确定位是仪表自动读数识别的重要步骤。提出一种基于形态学和纹理分析的仪表读数区域定位新方法。用图像重构技术清除图像边界及与边界相连接的结构,即仪表盘边框和指针,然后利用形态学算法来分割仪表盘的各个区域,最后用纹理统计分析方法和频谱度量方法定位出刻度区域,排除非刻度区域,这样进行指针读数时就可以只对指针和刻度进行处理,排除其它干扰。实验结果表明,对方形指针式仪表而言,上述方法能有效定位仪表刻度区域,且具有较强的鲁棒性和抗干扰性。 相似文献
20.
本文论述了二足步行机器人使用的新型脚力传感器。该脚力传感器能够较精确地测出二足步行机器人脚上所受的垂直负荷。利用该脚力传感器的输出能够较准确地计算出二足步行机器人的重心位置,对于步行的控制具有重要意义。 相似文献