首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 129 毫秒
1.
研究一种针对最近提出的动态环境下的机器学习理论——确定学习理论的算法实现,提出一种采用并行计算实现确定学习理论中的动态模式识别的方法。利用并行计算中的OpenMP多核编程环境,采用曙光16核服务器为硬件平台,实现对动态模式识别算法的快速性。同时,以压气机Mansoux模型为应用背景,把确定学习理论的动态模式识别方法应用到压气机旋转失速/喘振的快速检测中,利用多核并行计算实现了从包含多种旋转失速/喘振模式的模式库中快速识别当前模式的方法,为文章中方法提供了一个有效的验证。  相似文献   

2.
考虑到实现确定学习理论中的动态模式识别过程耗时过多,提出一种适用于识别过程计算的多核并行技术。以压气机Mansoux模型为研究背景,首先对其模式获取和识别的过程进行简单描述,其次,在四核PC的硬件平台上,使用OpenMP编程,实现了对动态模式识别的并行计算。通过设置不同的线程数,讨论了几个影响并行程序性能的重要因素。结果表明,要综合考虑各种因素的影响才能设计出高效的并行识别程序。  相似文献   

3.
排序学习(learning to rank)一直是机器学习领域的研究热点之一。作为解决排序学习的常用模型,线性RankSVM一直备受研究者关注。尽管现有的线性RankSVM已得到较有效地研究,但在训练大规模的线性RankSVM时,过长的训练时间依然难以让人接受。通过对当前最先进算法Tree-TRON的分析可知,利用信任区域的牛顿迭代(Trust Region Newton Method,TRON)去训练线性RankSVM模型涉及大量的Hessian-vector内积(Hessian-vector product)计算。同时完成Hessian-vector内积计算又需计算大量的辅助变量和矩阵运算。为了有效地加速与Hessian-vector内积有关的计算,本文在多核系统下提出了一种高效的并行算法(命名为PRankSVM)用于提高大规模线性RankSVM的训练速度。PRankSVM的特征主要体现以下两个方面:(1)训练数据按不同的查询划分为不同的子问题,(2)在多核系统下,利用多核加速辅助变量和相关矩阵的计算。通过实验分析可知,相较于现有的算法(如Tree-TRON),PRankSVM不仅可以有效地提高训练速度,而且可以有效地确保预测的准确率。  相似文献   

4.
董延军  李兴生 《测控技术》2014,33(9):113-115
介绍一种使用LabVIEW编程实现局域网文件传输的基本方法,利用LabVIEW软件特有的多核编程技术改进优化程序,通过使用生产者消费者循环优化程序的结构,使文件传输速度得到质的提升,并通过后期的局域网文件传输试验验证了这一结论。  相似文献   

5.
为了解决模式识别中的计算效率问题,文章研究GPU的体系架构,采用基于GPU的并行计算方法,针对人脸识别算法在GPU上做了相关实验,获得了较高的计算加速比,得到了采用基于GPU的并行计算方法可以较好解决在模式识别中的计算瓶颈问题的结论。  相似文献   

6.
研究了一种基于OpenMP技术的多核架构下并行蚁群算法,通过在TSP问题中的实验表明,该算法易于操作,而且充分利用了多核处理器并行计算的优势,提高了算法的运行效率。  相似文献   

7.
多核系统的软件开发方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对大规模多核系统软件开发过程中产生的问题,论述一套完整的开发方法,阐述该方法中可行性分析、并行模式分解、数据和任务依赖性分析、并行算法设计、并行编程模式的选择、编码和性能优化等步骤的实施要点。实践证明,该方法可用于指导编程人员开发多核应用程序,具有实际应用价值。  相似文献   

8.
多核微机基于OpenMP的并行计算   总被引:5,自引:2,他引:5  
随着四核微机走向市场和八十核处理器在实验室研制成功,多核正引领软件研发发生基础性变化。开发人员需要在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。文中探讨在多核微机上进行并行计算的实现技术。介绍了共享存储系统并行编程接口OpenMP的模型、指令和库函数,以及Intel C++编译器9.1和Microsoft Visual Studio 2005等对OpenMP的支持;着重探讨了二维离散快速傅里叶变换并行算法的设计、实现与优化技术;展望了高性能并行计算软构件库的开发前景。  相似文献   

9.
操作转换算法是实时协同编辑系统首选的并发控制算法,它不仅能提供不受限的交互,而且维护分布式操作的意图一致性。然而随着操作数目的增多,操作的响应时间也会延长。结合多核多线程技术的发展,提出了第一个并行的操作转换算法,其能减少远程操作集成到本地站点的时间开销。对传统的串行算法进行了改造,使得具有计算依赖的过程能够并行化。实验结果表明,提出的算法相较于传统算法具有较大的优势,在处理较大操作历史的情况下依然能够保证操作合理的响应时间。  相似文献   

10.
在通常的模式识别中,模式是明确、清晰、肯定的,但有些实际问题,模式本身很不明确,带有一定的模糊性,描这类模式最好借助于模糊集,借助于数据库技术,利用模糊模式识别的欧氏贴近度模型进行模糊预测将是本文的一大突破,该数据库应用软件在完满地解决了多变量、非线性的,大时滞的水泥强度预测这一实际问题后,将有广阔应用推广的前景。  相似文献   

11.
研究动态模式识别算法在GPU并行计算平台的实现。随着GPGPU(通用计算图形处理器)硬件的发展,基于GPU的大规模并行计算技术将有效地处理动态模式识别算法带来的海量计算问题。文中通过介绍动态模式识别算法,对算法中涉及的巨大计算量进行分析,并针对性地对其中密集计算部分进行并行化分解,移除原算法中在执行中存在的依赖关系,最终得到算法在特定的GPU平台———Jacket上的并行计算实现。实例验证表明,相比于原CPU串行程序,在GPU上运行的并行化程序能实现明显加速,因而具有很好的工程应用价值。  相似文献   

12.
高岚  王锐  钱德沛 《软件学报》2013,24(6):1390-1402
多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义。但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并行程序的普及和发展。分析了多核处理器造成并行程序确定性重放难以实现的关键因素,总结了确定性重放的评价指标,综述了近年来学术界对并行程序确定性重放的研究。根据总结的评价指标,从纯软件方式和硬件支持方式对目前的确定性重放方法进行了分析与对比,并在此基础上对多核架构下并行程序的确定性重放未来的研究趋势和应用前景进行了展望。  相似文献   

13.
随着深度学习的快速发展,卷积神经网络已广泛应用于计算机视觉、自然语言处理等人工智能领域中.Winograd快速卷积算法因能有效降低卷积神经网络中卷积操作的计算复杂度而受到广泛关注.随着国防科技大学自主研制的飞腾多核处理器在智能领域的推广应用,对面向飞腾多核处理器的高性能卷积实现提出了强烈需求.针对飞腾多核处理器的体系结构特征与Wingorad快速卷积算法的计算特点,提出了一种高性能并行Winograd快速卷积算法.该算法不依赖通用矩阵乘库函数,由卷积核转换、输入特征图转换、逐元素乘、输出特征图逆变换等4个部分构成,融合设计了4个部分的数据操作,并设计了与之配套的数据布局、多级并行数据转换算法与多级并行矩阵乘算法,实现访存性能以及算法整体性能的提升.在两款飞腾多核处理器上的测试结果显示,与开源库ACL和NNPACK中的Winograd快速卷积实现相比,该算法分别能获得1.05~16.11倍与1.66~16.90倍的性能加速;集成到开源框架Mxnet后,该算法使得VGG16网络的前向计算获得了3.01~6.79倍的性能加速.  相似文献   

14.
多核并行程序的调试是一个公认的困难问题,困难主要来自于程序执行的不确定性.可重现调试(replay debug)提供了消除程序中不确定性的能力,但是现有的可重现调试解决方案都无法应用于商用的软硬件平台中,且进行调试所带来的性能损失会随着并发度的增加而超线性地增长.提出了一种基于运行快照的新型并行程序调试方法SDT(snapshot debug tool).该方法以离线的断点设置、运行快照捕捉和运行快照细化为基础,提出了一套可以指导用户由粗到细发现错误的调试过程,并在通用的软硬件平台上进行了实现.实验结果显示,在8线程的并发条件下,使用SDT调试所带来的时间性能损耗平均为5188%;同时当线程数增长4倍时,使用SDT所带来的额外时间消耗最多增长1倍,具有很好的可扩展性.记录快照的数据量是影响SDT性能的重要挑战,实验证明通过使用增量式的快照记录方式可以有效地降低需要记录的数据量,减少记录快照花费的时间,提高SDT的整体性能.  相似文献   

15.
局部Gabor二值模式直方图序列(histogram sequence of local Gabor binary patterns,简称HSLGBP)的人脸识别方法具有较高的识别率,但该方法的特征计算较复杂、耗时长,并且特征维数高、匹配速度慢.给出一个并行的HSLGBP方法(简称P-HSLGBP),在多核PC机群上使用MPI实现了该方法,并使用该方法对ORL人脸库中的40人共400幅图像做了实验.理论分析和实验说明了P HSLGBP方法具有较高的加速比和并行计算效率.在保证高识别率前提下,在由10个双核PC机组成的机群环境下的加速比达到17.同时,P-HSLGBP方法具有良好的可扩展性,适于大规模人脸库的快速识别.  相似文献   

16.
给出煤矸石组分模式识别的模糊神经网络模型 ,提出一种实用生态算子 ,同时将在此基础上构建的生态遗传算法用于模糊神经网络的离线学习。仿真和实验结果显示 :新算法使网络具有良好的收敛性能 ,而且从训练好的定量网络中提取的模糊规则提高了煤中矸石的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号