首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 78 毫秒

1.  基于双索引的子图查询算法  
   陆慧琳  黄博《计算机工程》,2015年第41卷第1期
   传统的子图查询算法大多只在图数据库上进行一次挖掘算法,即在图数据库上建立稳定的数据库索引后将不再对索引进行更新.随着查询兴趣的改变或数据库的频繁更新,原有的数据库索引将不再能提供有用的信息来减少查询过程中候选图的数量.为此,提出一种双索引的子图查询算法,同时在数据库和查询流上挖掘频繁子图并建立索引.子图查询和查询流索引的建立同步进行,即使查询兴趣改变,查询流索引也能自适应地更新索引信息来优化查询效率.针对数据库的频繁更新,查询流索引已提供实时的有效信息,数据库索引无需重新建立.实验结果表明,双索引的结合能有效提高查询子图的处理效率.    

2.  一种基于前缀节点的频繁子图挖掘算法  
   李海波  王元珍《计算机应用研究》,2010年第27卷第7期
   基于频繁子树挖掘算法中的前缀节点思想,将模式图分为图核—分支—连接向量三个部分,提出了CBE算法。对在分支上扩展得到的候选模式图,CBE算法能够在常数时间内完成规范化判定。通过实验证明CBE算法的子图挖掘效率有显著提高。    

3.  基于最小生成树的图数据库索引算法  被引次数:1
   李 楠  高 宏  李建中《软件学报》,2009年第20卷第Z1期
   对复杂数据进行图模式建模近几年越来越流行,因此,在查询执行的优化过程中图索引技术变得至关重要.研究了图模式的索引问题,并且提出了一种近似的索引方法,称为MSTA方法.MSTA方法利用最小生成树结构作为索引特征,依据最小生成树边序列的包含关系和基于最大公共子图的图距离度量,将最小生成树组织到一个称为MST树的索引结构中.MST树索引结构可以高效地支持多种查询,例如子图查询.MSTA方法具备高效的索引性能.在索引大小和索引建立时间方面,传统方法是MSTA方法的数十倍,甚至上百倍.MSTA方法虽然不能返回完整结果,但是可以返回经图距离度量排序最好的部分结果.    

4.  使用二级索引的中文分词词典  被引次数:3
   张庆扬  柴胜《计算机工程与应用》,2009年第45卷第19期
   中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础,它将告诉算法什么是词,由于在算法执行过程中需要反复利用分词词典的内容进行字符串匹配,所以中文分词词典的存储结构从很大程度上决定将采用什么匹配算法以及匹配算法的好坏。在研究现存分词词典及匹配算法的基础上,吸取前人的经验经过改进,为词典加上了多级索引,并由此提出了一种新的中文分词词典存储机制——基于二级索引的中文分词词典,并在该词典的基础上提出了基于正向匹配的改进型匹配算法,大大降低了匹配过程的时间复杂度。从而提高了整个中文分词算法的分词速度。    

5.  基于压缩全文索引的演变图查询  
   肖洋  朱青  吴粤皖《计算机工程与应用》,2015年第2期
   演变图中含有大量的时间和空间信息,其中某些空间信息随着时间的推移表现出相似的演变规律。给出了一种演变图查询模型,可以挖掘出在相同时间范围内具有相同变化规律的演变子图。但是演变图的规模往往是巨大的,当需要对其进行多次查询时,每次遍历整个演变图将带来非常高的查询代价,而现有的基于枚举的哈希索引算法又使得预处理过程拥有相当大的时间和空间开销,为了减少对大规模演变图的预处理代价,将压缩的全文索引技术应用于演变图,它基于涡轮转换和后缀数组。在构建后缀数组时,给出了两种不同的线性算法,确保了预处理过程的稳定性。通过在Facebook、Enron邮件系统以及模拟数据集上的实验,评估了该算法的可行性、效率以及可扩展性。    

6.  基于多重索引模型的大规模词典近似匹配算法  被引次数:1
   龚才春  黄玉兰  许洪波  白硕《计算机研究与发展》,2008年第45卷第10期
   编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法.传统单索引模式很难在高性能的前提下保证高召回率.词典越大问题越严重.提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划分为若干子词典,对各子词典按照一定策略建立unigram,bigram,trigram,quadgram中的一种或若干种索引,当查找用户模式P的近似匹配时,根据模式P检索特定N-gram索引链,从而得到候选近似匹配集合C,对C中每一个单词W,计算P与W的编辑距离即可输出P的所有最终匹配结果R.实验表明,基于多重索引模型的词典近似匹配算法能够大幅度减少候选近似匹配结果的数量,从而提高词典近似匹配的速度.    

7.  一种XML数据流之上持续查询执行器的增量维护方法  
   高军  杨冬青  王腾蛟  唐世渭《计算机研究与发展》,2005年第42卷第5期
   在XML数据流的海量持续查询处理领域中,很少有研究涉及到在查询集合发生变化的情况下,如何调整查询执行器以满足当前查询集合的问题.由于XML数据查询的数目是海量的,查询执行器重新构建的代价非常高.针对上述问题,提出了基于转换累计自动机的查询执行器的增量维护方法,来完成查询集合的增量增加和删除,从而避免了执行器重构的昂贵代价.同时,利用XML文档DTD结构约束,提高了查询执行器增量维护的效率,减少了增量维护所导致的空间冗余.实验表明,该方法能够以有限空间为代价,有效完成XML数据流持续查询执行器的动态维护.    

8.  基于双索引的近似子图匹配  
   黄云  洪佳明  覃遵跃《计算机应用》,2012年第32卷第7期
   越来越多的大型复杂网络使得图结构的研究变得日益重要,其中近似子图查询备受关注.为了提高查询效率,利用顶点的邻接关系特征为每个顶点建立索引,减少了匹配顶点的数量;并基于结构和标签对大型数据图进行划分,缩小了匹配时的搜索空间.利用离线时建立的双索引,查询时首先利用顶点间的近邻关系判定公式过滤掉大量不满足匹配关系的候选顶点,然后在一定的划分空间中进行边的匹配.真实数据集中的实验表明,与单纯的划分方法或近邻关系索引相比较,双索引机制对于查询的效率和准确率方面均有明显改善.    

9.  基于相点分析的移动数据索引技术  
   叶小平  郭欢  汤庸  陈罗武  周畅  廖青云《计算机学报》,2011年第34卷第2期
   一维(有效)时间区间(VT)和二维最小限定矩形(MBR)是移动数据基本的时空单元,两者性质不同,应用中也有差异.现有移动数据查询通常是将相关数据转换为高出原空间情形一维的空间数据,其优势在于可充分使用现有空间数据索引技术.文中主要贡献在于研究基于过去和当前时间查询的移动数据索引模式,该索引模式能够表征时空各自特性并实现时空模块的整合配置.首先,文中将有效时间期间VT和空间MBR统一描述为广义区间,并通过区间数将其转化为平面上相点,实现了数学上的整合表述与刻画;同时,根据VT和MBR各自反映的时空特征,引入了基于时态拟序的时间相点线序划分和基于扩展KD-tree的空间相点MBR分类,建立时空相点分析基本框架;然后,在相点分析框架内实现时间和空间索引模块组建和整合配置,实现了移动数据索引模式Modim;另外,研究了基于当前与现在时间Modim数据查询以及索引增量式更新算法,并建立相点编码方案以实现最终查询结果的重构;最后,设计相关仿真以实现对Modim性能评估,与现有相关工作进行基本比较的结果表明文中工作是可行的和有效的.    

10.  面向成组对象集的增量式属性约简算法  
   钱进  朱亚炎《智能系统学报》,2016年第4期
   现实世界中数据集都是动态变化的,非增量式属性约简方法从头重新计算原始数据集,而且未考虑先前约简结果中的信息,将耗费大量的时间和空间。为此,讨论了动态数据环境下约简的不变性,提出了一种面向成组对象集的增量式属性约简算法,利用先前约简中信息来快速获取强传承性的约简,从而提高增量式学习算法效率。最后,将该算法与非增量式约简方法和面向单个对象的增量式约简方法在UCI数据集和人工数据集上进行了相关比较。实验结果表明,面向成组对象的增量式属性约简算法能够快速处理动态数据,具有较好的约简传承性。    

11.  扩展子图同构问题的优化算法  
   徐凯旋  鲁道夫《计算机工程》,2011年第37卷第19期
   针对扩展子图的匹配问题,根据Ullmann剪枝和QuickSI的不同特性,提出优化处理距离信息的加边算法。根据Query中各个顶点到不同label顶点的最短距离进行剪枝,采用动态加边算法减少加边的运算时间,能够处理规模不大的稀疏图。在AIDS数据库上的实验结果表明,在不同距离值的条件下,QuickSI算法的平均运行速度比Ullmann算法快一个数量级以上。    

12.  索引和索引调整向导  
   闪四清《个人电脑》,1999年第5期
   索引是一种加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅整本书就能迅速地找到所需的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。在书籍中,索引就是内容和相应页号的清单。在数据库中,索引就是表中数据和相应存储位置的列表。索引可以大大减少数据库管理系统查找数据的时间。索引调整向导是一种工具,它通过使用查询优化器来分析查向任务的工作量,向有大量工作量的数    

13.  基于信息熵的子图匹配算法  
   孟凡荣      闫秋艳《计算机应用研究》,2012年第29卷第11期
   子图查询是指输入一个图数据库和查询子图,输出图数据库中包含查询子图的图集合,它广泛应用于社会网、生物网和信息网的查询应用中。目前的子图查询算法大多采用静态消耗测算模式,此类测算模式在图中点数和连接边数呈指数分布时,会在少数节点上花费较多时间遍历其邻节点,导致查询算法效率低下。根据信息熵在信息度量中的作用,将条件信息熵作为启发式匹配的依据,提出了基于信息熵的子图匹配算法。实验表明,基于信息熵的子图匹配算法具有更高的查询效率,且在指数分布的数据集上效果更明显。    

14.  F-Index:一种加速Twig查询处理的扁平结构索引  
   周军锋  孟小峰  蒋瑜  谢敏《软件学报》,2007年第18卷第6期
   如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查询无关的元素,在处理深度嵌套的复杂结构XML文档时具有很大的优势.提出一种新的查询算法,能够有效处理过滤后剩余元素的匹配问题.基于不同数据集的实验表明,使用F-Index进行过滤可以极大地提高查询处理的性能.    

15.  资料索引  
   《工程质量》,2005年第12期
   自愿协议是推动我国节能的有效途径自愿协议是在政府的引导下更多地利用企业的积极性来促进节能的一种非强制性措施。自愿协议具有灵活性好、适用性强、有利于发展政府与工业部门(企业)之间关系的优点。自愿协议将确定企业自愿承担的任务、时间进度以及在规定的时间内达到的节能目标,同时企业应得到政府给予的鼓励和优惠政策。自愿协议可使企业的管理理念发生变化,对企业产生较大的推动力,使企业和政府间、行业和公众间进行良好的对话和建立信任,推动各项政策的贯彻执行。企业实现自愿协议节能目标,也将有力地提高企业的经济效益,降低生产成…    

16.  基于索引排序的快速动态区域匹配算法  被引次数:2
   姚益平  张颖星  陈欣  季利春《计算机学报》,2009年第32卷第7期
   数据分发管理实现基于值的过滤,可进一步减少大规模仿真中盟员接收冗余数据的可能性和网络中的数据流量.数据分发管理实现的关键是区域匹配算法的实现,高效、精确的区域匹配一直是数据分发管理追求的目标.现有的区域匹配算法如直接匹配法、网格法、基于分类的算法等都不很理想,或者过滤效果不佳,或者耗时较大,难以适应大规模分布式仿真的需要.论文针对在区域比较多的大规模分布式仿真系统中,区域大都需要随着仿真的推进而频繁地被动态修改的实际特点,提出了一个基于索引排序的快速动态区域匹配算法--IOBM算法,该算法将范围的上下界分别各用一个节点表示,使用指针数组来索引每一维上的范围节点,数组元素的下标值表示对应的节点值,利用区域范围更新前后的信息,将匹配限定在移动区间之内,通过对移动区间之内的链表进行直接操作来完成匹配工作,因而大大减少了匹配计算的时间,实现了高效、精确的动态匹配.该算法尤其适合区域比较多的大规模分布式仿真的需要.    

17.  基于双支持向量回归机的增量学习算法  
   郝运河  张浩峰《计算机科学》,2016年第43卷第2期
   提出了一种基于双支持向量回归机的增量学习算法。将获取到的新样本加入训练数据集后,该算法无需在整个新的数据集上重新训练双支持向量回归机,而是充分利用增量前的计算信息,从而大大减少了模型更新中逆矩阵的计算量,提高了算法的执行效率。在人工数据集、时间序列预测和UCI数据集上的数值实验表明,该算法快速有效。    

18.  增量式CURE聚类算法研究  被引次数:3
   冯兴杰  黄亚楼《小型微型计算机系统》,2004年第25卷第10期
   聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的更新 .由于数据量大 ,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效 ,因此亟待研究增量式聚类算法 .通过对 CURE聚类算法的改进 ,提出了一种高效的增量式 CU RE聚类算法 .它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题 .实验结果显示本算法是一种有效的增量式聚类算法    

19.  基于边映射表连接的匹配算法  
   曹春萍    《计算机应用研究》,2013年第30卷第9期
   针对面向语义网络图匹配的特殊性, 在基于状态回溯搜索算法的基础上提出一种新的称为基于边映射表连接的匹配算法, 利用语义网络图的有向性, 将图匹配问题转换为对搜索路径的规划, 并采用深度优先算法形成搜索步, 同时对目标图的所有边建立索引, 加快以边匹配为中心形成边映射表的过程, 最后对边映射表进行连接形成结果集。在真实数据集上的实验结果表明, 该算法具有较高的执行效率。    

20.  时空数据库索引方法研究  被引次数:1
   祝蜀平  赵瑾瑾《计算机技术与发展》,2008年第18卷第7期
   时空数据库作为数据库研究领域中的一个重要分支,经过近十年的发展,在时空数据模型、时空查询优化与索引和时空本体论等方面取得了许多成果.现实世界中的许多实体都具有空间特性和时态特性,需要数据库管理系统提供有效的时空数据管理能力,如地籍管理系统中的地块、交通管理系统中的车辆等.时空数据库用于管理形状和位置随时间变化的对象.为了快速访问其庞大的数据量,必须建立有效的时空索引以提高各类时空查询的效率.提出了一种新的时空索引方法(SEST索引),它综合了快照和事件这两种时空信息建模方法.不仅能够处理时间片查询和时间段查询.而且能够进行事件查询.SEST索引使用R-tree结构来存储快照,用一种日志数据结构来存储发生在两次相邻快照之间的事件.通过实验对比SEST索引和HR-tree,结果表明:当变化频率在1%到13%之间时, SEST索引比HR-tree需要的存储空间少;当变化频率在1%到7%之间时,在时间段查询方面,SEST索引比HR-tree要好.因为SEST索引是一种面向事件的结构,所以事件查询时效率很高.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号