首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 20 毫秒
1.
为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式.基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式.利用任务调度器,设计了N皇后问题在多核处理器的并行算法.该算法将任务自动地映射到多线程,减少消息传递和数据移动带来的额外开销,提高多核CPU的使用效率.并行算法的加速比接近核数,CPU使用效率超过90%,实验结果表明,该算法有效地提升了多核计算机资源的利用率.  相似文献   

2.
主要研究多核系统的能耗最优化问题。首先,根据多核系统的特点,建立关于多核系统的任务、能耗模型;接着,设计和实现一种基于蚁群最优化能耗调度算法。本文算法以蚁群算法的概率状态转移规则为核心,通过全局信息激素更新的策略,避免了陷入局部最优的情况,从而获得全局最优解。通过实验比对,分别与贪心算法、穷举算法比较后发现:本校提出的调度算法,在最佳情况下,仅比最优能耗高0.7%,而该算法复杂度低,可以应用于任务输入集较大的场景。   相似文献   

3.
特征点检测被广泛应用于目标识别、跟踪及三维重建等领域。针对三维重建算法中特征点检测算法运算量大、耗时多的特点,对高斯差分(Difference-of-Gaussian,DoG)算法进行改进,提出特征点检测DoG并行算法。基于OpenMP的多核CPU、CUDA及OpenCL架构的GPU并行环境,设计实现DoG特征点检测并行算法。对hallFeng图像集在不同实验平台进行对比实验,实验结果表明,基于OpenMP的多核CPU的并行算法表现出良好的多核可扩展性,基于CUDA及OpenCL架构的GPU并行算法可获得较高加速比,最高加速比可达96.79,具有显著的加速效果,且具有良好的数据和平台可扩展性。  相似文献   

4.
针对给定特征的数据集,选择最佳推荐算法存在计算资源相对过高、耗时较长、正确率较低的问题,提出一种基于元学习的推荐算法选择优化框架,在常用元特征的基础上融入新的特征测度。将Donorschoose和Movielens作为实证数据集,实验分析KNN、SVD等算法的自动选择过程,通过3种元学习算法构建元模型,评估该模型的预测正确率。StackingDecisionTree元模型所选择推荐算法具有较高预测性能,预测正确率分别达到86.58%和80.39%,实验结果表明了提出框架的可行性。  相似文献   

5.
刘颖  刘德彦  吕政  赵珺  王伟 《控制与决策》2024,39(8):2622-2630
为了提高多核学习(MKL)的表示能力同时降低其计算成本,提出一种融合深度特征与多核学习的最小二乘孪生支持向量机(LSTWSVM)算法.针对支持向量机等核分类器在多核学习中高计算复杂度的问题,提出一种基于边缘错误最小化原则的多核LSTWSVM框架,利用分类器优势提高多核学习的性能.针对高斯多核浅层结构的问题,采用MKL法设计一种基于深度神经网络多层信息的高鲁棒性深度映射核,将此深度核与多尺度高斯基核以核矩阵哈达玛积方式相融合,构造一组新的具有高度表达能力的改进核.最后,将基于LSTWSVM的多核训练算法与改进的多核结构进行高度集成,通过大量基准数据集与工业数据实验表明,其能有效结合深度学习与多核学习的优势,且以较低的计算成本提高分类精度与泛化能力.  相似文献   

6.
随着以大内存和多核为代表的计算机硬件技术的发展,以cache-conscious算法为中心的查询优化技术逐渐转向以multicore-conscious为中心的查询优化技术,来提高多核处理器的并行处理性能.该文的研究目标是具备复杂星型连接特点的联机分析处理OLAP技术,以查询执行代价最大的星型连接为研究对象,提出同时满足cache-conscious和multicore-conscious的多核并行连接算法DDTA-MPJ.该算法包括基于事实表水平分片和维属性列共享访问模式的查询内多核并行算法IntraDDTA-MPJ、基于QuerySlots的查询间多核并行算法InterDDTAMPJ以及中位数多核并行算法Median-MPJ.实验结果表明该算法具有良好且稳定的并行查询处理性能,线性查询处理模型能够更好地利用多核处理器的先进性能.  相似文献   

7.
针对传统k_means聚类算法在处理海量数据时所面临的内存不足、运算速度慢等问题,提出了一种基于MapReduce的K_means并行算法,同时为了改善k_means算法在初始值确定方面的盲目性,采用canopy算法进行改进。实验结果表明,基于MapReduce的K_means并行算法和改进后的算法均能产生良好的聚类效果,不仅提高了聚类质量,而且在处理大数据集方面,改进后的算法的还能够得到趋近于线性的加速比。  相似文献   

8.
分析K-Medoids算法的内在并行性,设计一个适合多核平台的并行算法,并利用OpenMP进行实验。实验结果表明,并行算法对多核环境有很好的适应性,在双核及四核计算机上均获得了较好的加速比与运行效率。  相似文献   

9.
研究了两个基础空间分析算法(大量线段求交、点面叠加)的实现方法,并基于单机多核环境,利用()pcnMP实现了并行算法。通过分析并行算法,得到了无法取得线性加速比的原因,即负载不均衡,内存管理采用全局方法,仍然是“串行”的。基于此,通过对数据进行有效的排序并利用()pcnMP的动态调度方式进行调度;改进了现有的并发内存分配技术,并将其用于并行算法的内存管理。利用以上方法对并行算法进行了优化,测试表明,优化后的算法具有较为理想的近线性加速比,单机四核环境下,每个核心的计算效率不低于80%。  相似文献   

10.
针对基于回溯的迭代硬阈值算法(BIHT)迭代次数多、重构时间长的问题,提出一种基于回溯的共轭梯度迭代硬阈值算法(BCGIHT)。首先,在每次迭代中采用回溯思想,将前一次迭代的支撑集与当前支撑集合并成候选集;然后,在候选集所对应的矩阵列张成的空间中选择新的支撑集,以此减少支撑集被反复选择的次数,确保正确的支撑集被快速找到;最后,根据前后迭代支撑集是否相等的准则来决定使用梯度下降法或共轭梯度法作为寻优方法,加速算法收敛。一维随机高斯信号重构实验结果表明,BCGIHT重构成功率高于BIHT及同类算法,重构时间低于BIHT 25%以上。Pepper图像重构实验结果表明,BCGIHT重构精度和抗噪性能与BIHT及同类算法相当,重构时间相较于BIHT减少50%以上。  相似文献   

11.
伍世刚  钟诚 《计算机应用》2014,34(7):1857-1861
依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之间的传输开销,在CPU与GPU之间采取异步传送和不完全传送数据、GPU多个内核函数异步执行多个流的方法,设置GPU block线程数量为16的倍数、GPU共享存储器划分大小为32倍的bank,使用GPU常量存储器存储交叉概率、变异概率等需频繁访问的只读参数,将输入串矩阵和重叠部分长度矩阵只读大数据结构绑定到GPU纹理存储器,设计实现了一种多核CPU和GPU协同求解最短公共超串问题的计算、存储和通信高效的并行算法。求解多种规模的最短公共超串问题的实验结果表明,多核CPU与GPU协同并行算法比串行算法快70倍以上。  相似文献   

12.
大整数运算广泛地应用于公钥加密算法、大规模科学计算中高精度浮点数运算类以及构建大特征值等领域,然而其大部分算法空间和时间开销都很大,尤其对于核心运算之一的大整数乘法,当数据达到一定规模时,超长的串行计算时间已成为制约算法应用的巨大瓶颈.近几年来,伴随着多核、众核芯片的迅猛发展,通过充分挖掘算法本身的并行度以利用并行处理器的强大计算能力,进而高效地提升算法性能,成为一种研究趋势.本文基于通用多核并行计算平台,研究了大整数乘法Comba及Karatsuba快速算法的并行化,提出了高效的多核并行算法.在算法实现及性能优化上,采用了OpenMP+SIMD的多级并行技术,使性能获得巨大提升.在性能测试上,我们使用优化的并行算法与原始串行算法进行对比试验,结果显示,8线程并行Comba算法和Karatsuba算法相比串行对应算法分别实现了5.85倍以及6.14倍的性能加速比提升.  相似文献   

13.
针对人工鱼群算法在复杂多峰函数优化问题上寻优精度低、后期搜索能力减弱且运行时间长等问题,提出一种基于多核机群的人工鱼群并行算法(PDN-AFS)。首先对人工鱼群算法的优势与不足进行分析,采用动态权衡因子策略并适时引入小生境机制,提出一种新的人工鱼群(DN-AFS)算法;然后根据多核机群的并行编程模型(MPI+OpenMP),对DN-AFS算法进行并行设计与分析,提出基于多核机群的人工鱼群并行算法;最后在多核机群环境下进行仿真实验。实验结果表明:该算法有效地提高了复杂多峰函数优化问题的收敛速度和寻优性能,并获得了较高的加速比。  相似文献   

14.
针对空间探测系统仿真中生成星空背景图像不能及时响应的弊端,提出一种利用多核加速生成星空背景图像的算法.阐述星空背景图像产生弥散效果的原理,在二维高斯模型的中心衰减函数基础之上对星空背景弥散效果进行建模仿真,并给出了一种基于多核处理器的并行实现方法.通过对不同恒星数目的星空背景进行仿真,分析了基于多核的并行算法相对于基于单核的串行算法的加速比,得出基于多核处理器的星空背景弥散效果实现算法基本能满足实时性要求.  相似文献   

15.
发掘并掌握站内乘客群体的聚集时空变化规律,对于优化城市轨道交通线网间车辆的调度,特别是优化灾害条件下的客流组织管理等,具有积极的作用.针对具有密度分布非均匀特征的车站乘客位置数据集,提出一种基于高斯混合模型的DBSCAN聚类算法.首先,利用高斯混合模型对数据集进行密度的分层处理;然后,面向不同密度层次的数据集进行局部聚类,确定各密度层数据集的参数,并选取恰当的种子以完成局部聚类簇扩展;最后,将各密度层次数据集的聚类结果进行合并.通过标准和实测数据的计算结果表明,基于高斯混合模型优化后的DBSCAN算法,对于非均匀密度分布的乘客位置分布数据具有更好的聚类效果.  相似文献   

16.
崔建双  吕玥  徐子涵 《控制与决策》2021,36(5):1223-1231
设计并实证研究一种基于地标特征和元学习方法推荐最佳优化算法的实现框架.地标特征摒弃了传统的问题简单特征、统计特征和信息理论特征复杂的提取过程,通过简化运行算法并仅以算法的相对性能表现作为问题特征集.在此基础上,利用元学习方法训练建模并针对新问题作出算法推荐.为验证推荐效果,以多模式资源约束的项目调度问题(MRCPSP)...  相似文献   

17.
为检测数据中的异常信息,提出基于高斯过程模型的异常检测算法。高斯过程可以根据训练样本从先验分布转到后验分布,对核函数的超参数进行推理,预测输出具有清晰的概率解释。对基于高斯过程模型的异常检测算法进行定义和描述,用Server Computers(电脑服务器)数据进行仿真实验,结合高斯过程先验和回归理论,在实验中选取RBF作为核函数,利用目标类数据的特性构造特征向量集,在TE工业过程时序数据集上验证了该算法的适用性和有效性。  相似文献   

18.
提出多类型激活函数的径向基网络结构设计方式,网络隐层由薄板样条函数节点和高斯函数节点构成,分别采用改进的粒子群算法和前向局部优化算法对两种类型节点的参数进行学习.改进的粒子群算法综合运用粒子运动过程的启发式信息和样本的梯度信息进行种群迭代,减小了陷入局部极值的概率.前向局部优化算法是一种高斯节点的序贯学习算法,算法采用DFP方法对新增高斯节点的参数进行局部优化,提高了网络的逼近性能.通过解析和工程算例验证了多类型激活函数RBF网络的高拟合能力及其学习算法的有效性.  相似文献   

19.
针对当前稀疏数据推荐准确率低的问题,提出一种基于多核学习卷积神经网络的稀疏数据推荐算法.将项目的辅助信息送入卷积神经网络学习特征,将向量在可再生核希尔伯特空间组合,利用多核学习技术增强卷积神经网络的特征学习能力;基于学习的卷积特征集初始化非负矩阵模型,通过非负矩阵模型实现对缺失评分的预测.实验结果表明,该算法有效提高了稀疏数据集的推荐性能,验证了多核学习卷积神经网络的有效性.  相似文献   

20.
Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号