首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 640 毫秒

1.  Asyn-SimRank:一种可异步执行的大规模 SimRank 算法  
   王春磊  张岩峰  鲍玉斌  赵长宽  于戈  高立新《计算机研究与发展》,2015年第7期
   SimRank 算法利用网络结构来评估网络中任意2点的相似性,它被广泛应用于社交网络和链接预测等诸多领域中.近年来,随着大数据技术的发展,SimRank 算法处理的数据不断增大,人们利用MapReduce 等分布式计算模型设计实现分布式的大规模 SimRank 算法来适应大数据处理的需求.但是,由于 SimRank 算法包含开销较大的迭代过程,每次迭代之后都需要一个全局同步,且每次迭代的计算复杂度高、通信量大,SimRank 算法不能在分布式环境下高效地实现.1)提出 Asyn‐SimRank 算法,该算法采用迭代‐累积的方式完成迭代计算,异步执行 SimRank 的核心迭代过程,避免了大规模分布式计算中的大量同步开销,同时有效降低计算量并减少通信开销;2)提出关键点优先调度计算,提升了 Asyn‐SimRank 算法的全局收敛速度;3)证明了 Asyn‐SimRank 算法的正确性和收敛性以及关键点优先调度计算的有效性;4)支持异步迭代的分布式框架 Maiter 上实现了 Asyn‐SimRank 算法.实验结果显示,相比较于 Hadoop ,Spark 上实现的 SimRank 算法和 Delta‐SimRank 算法,Asyn‐SimRank 算法大大提升了算法的计算效率,加速了算法收敛.    

2.  基于MapReduce的SimRank算法在图聚类中的应用  
   冷泳林  鲁富宇《电子设计工程》,2015年第6期
   由Jeh和Widom提出的SimRank算法是一种普适"结构相似度"计算模型。由于SimRank算法采用迭代方式计算图节点间相似性,因此时间复杂度和空间复杂度都非常高。随着数据量的激增,单机运算能力不能满足大规模数据的计算要求。本文提出了基于MapReduce计算模型的分布式SimRank算法,利用该算法对RDF图进行相似度度量,然后利用分布式的AP聚类算法对图节点进行聚类分析。实验结果表明,该方法能够高效的完成图节点的相似度度量,实现图的有效聚类。    

3.  S—SimRank:结合内容和链接信息的文档相似度计算方法  
   蔡元哲  ;李佩  ;刘红岩  ;何军  ;杜小勇《计算机与生活》,2009年第4期
   文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法——S-SimRank(Star—SimRank),有效地将文档的内容信息和连接信息结合在一起从而提高了文档相似度计算的准确性。S-Simrank算法在ACM数据集上无论是准确性和效率都比其他算法有了很大地提高。最后,给出了S—SimRank的收敛性的数学证明。    

4.  S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)  
   蔡元哲  李佩  刘红岩  何军  杜小勇《计算机科学与探索》,2009年第3卷第4期
   文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法—S-SimRank(Star-SimRank),有效地将文档的内容信息和连接信息结合在一起从而提高了文档相似度计算的准确性。S-Simrank算法在ACM数据集上无论是准确性和效率都比其他算法有了很大地提高。最后,给出了S-SimRank的收敛性的数学证明。    

5.  基于链接关系的Web页面相似度搜索  
   《计算机应用与软件》,2014年第1期
   Web页面相似度搜索对于网络新闻推荐、近似查询等研究领域具有重要作用。SimRank是经典的相似度计算模型,但其预计算时间和空间开销非常巨大,不适用大规模Web页面网络。利用SimRank快速收敛的特点,在SimRank基础上提出高效Web页面相似度搜索方法(WSR),预计算1步迭代相似度矩阵,根据预计算的1步迭代相似度矩阵在线计算给定查询页面和其他页面的2步迭代相似度。通过对Web网络进行静态剪枝,进一步提高预计算和在线查询处理的效率。实验结果显示,WSR显著降低了存储开销和预计算时间开销,且具有较高精确度和快速查询响应时间。    

6.  基于相似度的关系模式和本体间映射算法  
   钱鹏程  王英林  李鹏《计算机仿真》,2009年第26卷第11期
   为了解决关系数据库模式和本体间的集成问题,存在映射关系,针对模式映射算法,提出了一种基于概念间相似度的计算策略,在相邻结点的相似度推断当前结点的相似度的过程中,根据结点相邻元素的数目对结构化相似度的计算赋予不同的权重;同时为了提高算法的收敛速度,在迭代过程中将初始值作为迭代值的一部分加入迭代过程中的相似度,并使用两次迭代结果的线性相关系数作为判断收敛的依据.实验结果表明,改进后的算法在映射的精度和收敛速度上都优于同类型的其它算法.    

7.  按需印刷平台中的相似搜索研究  
   张明西  张雷洪  吕巍  孙刘杰《包装工程》,2015年第23期
   目的 研究按需印刷平台中的相似搜索效率问题。方法 利用用户与产品之间的 “购买” 关系构建 “用户-产品” 关系, 基于P-Rank提出一种高效的相似搜索方法POD-Rank, 用于从 “用户-产品” 关系中发现相似产品。POD-Rank相似搜索过程依据 “用户-产品” 关系离线计算用户相似性, 并利用用户相似性在线计算产品相似性, 而后进一步提出优化的在线查询处理算法, 以降低查询处理的时间开销。结果 POD-Rank的计算时间开销和存储开销显著低于P-Rank, 而且能够快速响应查询请求。结论 POD-Rank 的相似性计算开销为 P-Rank 的 0.03%, 存储开销为 P-Rank 的 0.06%, 计算效果与P-Rank接近, 能够满足按需印刷平台中大规模产品数据处理的需求。    

8.  信息网络中一个有效的基于链接的结点相似度度量  
   张应龙  李翠平  陈红《软件学报》,2014年第25卷第11期
   信息网络无处不在.通过把网络中的对象抽象为点,把对象之间的关系刻画为边,相应的信息网络就可以用图来表示.图中结点相似度计算是图数据管理中的基本问题,在很多领域都有运用,比如社会网络分析、信息检索和推荐系统等.其中,著名的相似度度量是以Personalized PageRank和SimRank为代表.这两种度量本质都是以图中的路径来定义,然而它们侧重的路径截然不同.为此,提出了一个度量 SuperSimRank.它不仅涵盖了这些路径,而且考虑了Personalized PageRank和SimRank两者都没有考虑的路径,从而能够更加体现出这种链接关系的本质.在此基础上对SuperSimRank进行了理论分析,从而提出了相应的优化算法,使得计算性能从最坏情况O(kn4)提高到O(knl).这里,k 是迭代次数,n 是结点数,l 是边数.最后,通过实验验证了 SuperSimRank 优于 SimRank 和 Personalized PageRank,同时验证了优化算法在各种情况下都是有效的.    

9.  基于结构相似性的RDF数据聚类分割  
   冷泳林  鲁富宇《信息技术》,2015年第6期
   随着语义网的快速发展,RDF数据呈现出海量的增长特征,单机的RDF数据管理系统的可扩展性成为RDF数据发展的瓶颈,分布式的存储是解决这一难题的有效方法.而在数据的分布式存储中,数据分割是其中一个关键问题.文中根据RDF数据可以用有向图来描述特性,利用P-Rank基于结构的节点相似性度量方式计算图结点间的相似度,使用AP聚类算法对度量结果进行聚类,实现RDF数据的有效分割.实验结果表明,该方法能够有效地完成RDF数据的分割,使得类间相似度较小,而类内相似度较大.    

10.  一种求解线性方程组的SOR并行算法  
   张云  周华民  崔树标  李德群《计算机工程与科学》,2010年第32卷第10期
   逐次松弛迭代算法(SOR)是求解线性方程组的一种常用迭代算法,当系数矩阵正定时,它具有较快的收敛速度。但是,由于每个迭代步内存在数据相关,它难以实现并行计算。目前的SOR并行算法采用数据分解的方法,但由于该法并行区域过小,同步通讯代价大,并行效率低。本文提出了SOR的一种新型并行算法,该算法与传统SOR方法等价,具有相同的收敛性和迭代结果。该并行算法通过矩阵分块增大了可并行计算的区域,并引入流水线技术,利用各处理器间通讯与计算时间的重叠,获得较理想的并行加速效率。通过多核微机以及小规模集群上的数值实验证明,本文提出的SOR并行算法在求解大型稠密线性方程组时具有较好的并行效率。    

11.  基于权重标准化SimRank方法的查询扩展技术研究  被引次数:1
   马云龙  林原  林鸿飞《中文信息学报》,2011年第25卷第1期
   查询扩展是信息检索中的一项重要技术。传统的局部分析查询扩展方法利用伪相关文档作为候选词集合,然而部分伪相关文档并不具有很高的相关性。该文利用真实的搜索引擎查询日志,建立了查询点击图,经过多次图结构的转化得到能够反映词之间关联程度的词项关系图,并在图结构的相似度算法SimRank的基础上,提出了一种基于权重标准化的改进SimRank方法,该方法利用词项关系图中词项的全局和间接关系,能够有效挖掘与原始查询相关联的扩展词。同时,为降低SimRank算法的计算复杂度,该文采用了剪枝等策略进行优化,使得计算效率有大幅提高。在TREC标准数据集上的实验表明,该文的方法可以有效地选择相关扩展词。MAP指标较局部分析查询扩展方法提高了1.81%,在P@10和P@20指标评价中效果分别提高了5.44%和3.73%。    

12.  基于改进的FolkRank广告推荐及预测算法  
   范双燕  王志海  刘海洋《软件》,2014年第9期
   广告的点击率预测是指利用点击日记预测的点击率,其结果受到多方面因素影响,其中包括用户性质。有效的预测广告点击率,可以提高用户对网站展示广告的满意程度。基于Page Rank的Folk Rank算法在一个用户、资源、标签的三元组中进行迭代计算,求出推荐的标签。本文使用改进后的Folk Rank方法,通过个性化地从目标节点向其他各个结点传递权重,达到广告推荐的目的中,并实现对推荐广告的广告点击率预测。    

13.  基于二阶段相似度学习的协同过滤推荐算法  
       杨煜普《计算机应用研究》,2013年第30卷第3期
   针对传统的基于最近邻协同过滤推荐算法中计算相似度存在的缺陷,提出了一种基于二阶段相似度学习的协同过滤推荐算法,该算法旨在通过较少的迭代计算改善推荐算法性能。它以既约梯度法迭代寻优为主、最近邻算法为辅,通过邻居的海选和精选,最终提高了相似度的计算精度,改善了误差性能。实验表明,在一定条件下该算法不仅在误差性能上优于传统的推荐算法,而且其算法收敛速度快,可实现相似度参数动态调整和分布式计算。    

14.  面向实体识别的聚类算法  
   孙琛琛  申德荣  寇月  聂铁铮  于戈《软件学报》,2016年第27卷第9期
   实体识别是数据质量的一个重要方面,对于大数据处理不可或缺.已有的实体识别研究工作聚焦于数据对象相似度算法、分块技术和监督的实体识别技术,而非监督的实体识别中匹配决定的问题很少被涉及.提出一种面向实体识别的聚类算法来弥补这个缺失.利用数据对象及其相似度构建带权重的数据对象相似图.聚类过程中,利用相似图上重启式随机游走来动态地计算类簇与结点的相似度.聚类的基本逻辑是,类簇迭代地吸收离它最近的结点.提出数据对象排序方法来优化聚类的顺序,提高聚类精确性;提出了优化的随机游走平稳概率分布计算方法,降低聚类算法开销.通过在真实数据集和生成数据集上的对比实验,验证了该算法的有效性.    

15.  并发循环中多处理器同步问题的研究  
   李国治《华北电力大学学报(自然科学版)》,1992年第3期
   同步是一种为了保证相互协作的多个迭代按正确顺序执行,以获得与串行结果相同的技术。如果并行算法的一个迭代过程在交互点处需要等待其它迭代过程运行结束,称这个点为同步点。具有同步点的并行算法称为同步算法。由于在同步点处将出现等待,因而同步的出现将影响多处理器并行算法的运行效率,故在并行算法的构造中,应尽量减少同步点的设置。但对一个大的实际问题来说,同步又是很难避免的。本文即针对有并发循环存在的多处理机系统中所出现的同步问题展开讨论。它涉及到同步的基本概念,同步的探测,数据相关性,同步的建立与退出等一系列问题,这些是进一步研究同步策略与方法的重要基础。    

16.  RTM充模过程的自适应隐式控制体积法  被引次数:3
   江顺亮  任燕  梁声灼《复合材料学报》,2005年第22卷第6期
   提出了一种基于界面更新的RTM充模分析的自适应隐式控制体积法。该隐式方法的迭代方法只对已注满结点进行求解,然后更新界面结点的体积函数以便决定是否要更新界面。依据"一时间步,一单元层"的思想,采用最小二乘递推法估算隐式方法的时间步长,并依据压力估算每个控制体积的半注满时间,从而可以重构任何时间的流动前锋。计算表明,本文方法极大地提高了隐式方法的适用性,并把RTM充模数值模拟的计算时间复杂度降到结点数的2阶。    

17.  控制流图上支配关系计算方法的分析与实现  
   马红途  赵荣彩  苏彦兵《计算机科学》,2009年第36卷第3期
   支配关系在数据流分析和静态单赋值等程序分析和优化中应用很广泛.采用位向量表示支配结点集合,描述了采用迭代法计算控制流图上支配结点集合的算法,在支配结点集合的基础上讨论了对直接支配结点、支配边界结点的计算方法,并在NPB和SPEC2000测试集上进行了测试.测试结果表明:控制流图的构建占用了过程内支配关系计算的几乎一半时间;对于不包含goto语句的结构化程序,迭代算法一般只需迭代2次.    

18.  一般间隙及一次性条件的严格模式匹配  
   柴欣  贾晓菲  武优西  江贺  吴信东《软件学报》,2015年第26卷第5期
   具有间隙约束的模式匹配是序列模式挖掘的关键问题之一.一次性条件约束是要求序列中每个位置的字符最多只能使用一次,在序列模式挖掘中采用一次性条件约束更加合理.但是目前,间隙约束多为非负间隙,非负间隙对字符串中每个字符的出现顺序具有严格的约束,一定程度上限定了匹配的灵活性.为此,提出了一般间隙及一次性条件的严格模式匹配问题;之后,理论证明了该问题的计算复杂性为NP-Hard问题.为了对该问题进行有效求解,在网树结构上构建了动态更新结点信息的启发式求解算法(dynamically changing node property,简称DCNP).该算法动态地更新各个结点的树根路径数、叶子路径数和树根-叶子路径数等,进而每次可以获得一个较优的出现;之后,迭代这一过程.为了有效地提高DCNP算法速度,避免动态更新大量的结点信息,提出了Checking机制,使得DCNP算法仅在可能产生内部重复出现的时候才进行动态更新.理论分析了DCNP算法的时间复杂度和空间复杂度.大量实验结果验证了DCNP算法具有良好的求解性能.    

19.  超混合深度可重构计算阵列调度策略的优化研究  
   《计算机应用与软件》,2014年第6期
   针对一种新型的高性能计算机结构:超混合深度可重构计算机阵列(HRCA),提出两个在HRCA上任务分配的调度优化方法。(1)通过算核的优化分配减轻或消除由于算核分配引起的数据通信量急剧增加而导致的"存储墙"问题;(2)通过算粒的调度,将两次迭代间的数据交换与计算时间相重叠,缩短计算部件由数据交换导致的等待时间。以N-body FMM算法为例,验证了两种方法有效地降低了系统对于片外存储访问速度需求,提高了系统的利用率。    

20.  塑料注射充模过程流动分析的隐式控制体积法  被引次数:4
   江顺亮《中国塑料》,2005年第19卷第6期
   为了改善充模过程流动分析隐式方法的迭代过程,提出了一种基于界面更新的隐式方法。该方法只对已注满结点进行求解,然后更新界面结点的体积函数以便决定是否要更新界面。计算表明了隐式方法性能良好,计算速度比显式方法有量级程度的改进。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号