首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对XML文件的特点,提出一种对XML文件建立索引的方法。该方法所采用的数据结构和算法,在充分利用XML文件的标记所隐含的上下文信息提高查询准确率的同时,有较小的索引冗余和较快的查询速度。  相似文献   

2.
从分析查询条件的方式及其组合类型入手,介绍一种实现模糊查询的方法。并结合实际给出实现查询的程序。  相似文献   

3.
利用互联网上的社会化标注信息来改善查询扩展效果,是目前信息检索领域的一个研究热点.根据社会化标注系统中数据的特点,提出了一种改进的加权社会化相似度算法,称作Weighted Sim-Rank(WSR)算法,用于改善查询扩展效果.WSR方法在计算标签和网页之间边的权值时,既考虑与标签和网页共现的用户数量,又兼顾到被同一标签所标注过的不同网页数.所有的实验都是在从del.icio.us网站上抽取的真实标注数据集上进行的.实验结果表明,WSR方法能够有效地衡量标签之间的相似度,与其他几种基于社会化标注的方法相比,可以获得更有用的查询扩展信息,明显地改善了查询扩展的效果.  相似文献   

4.
一种基于语义关联的查询优化方法   总被引:7,自引:2,他引:5  
提出了一种综合词法关系和语义分析的查询优化方法。通过对查询关键字词法特性和本体实例之间语义关联强弱的分析,提高了查询关键字到本体概念映射的完整性和准确率,帮助搜索引擎对用户的意图做出有效推测,解决了传统搜索引擎不能很好理解用户意图的问题。设计实现了相应的查询优化系统,实验表明该系统可以有效提高搜索的准确率。  相似文献   

5.
6.
在网格应用环境中,资源信息的获取是进行其他工作的前提条件,因此,如何收集网格内结点的资源信息是十分重要的,提出了一种基于Globus Toolkit的信息服务组件——监控与发现服务(Monitor and Discovery Service,MDS)中提供的网格资源信息服务(Grid Resource Information Service.GRIS)和网格索引信息服务(Grid Index Information Service,GIIS)而设计出的一种在网格环境中实现资源信息查询的方法。  相似文献   

7.
许多领域的业务中均需要存储用户的数字标识,并在随后的系统业务处理过程中通过这些数字标识对用户信息进行检索。针对这一现状,为了同时满足对用户信息精确和模糊检索的需求,文章以数据挖掘预处理中基于概念树的数据浓缩思想为基础,提出了一种基于数据隐含涵义的有效存储查询方法———DCMQ。解析分析表明该方法不仅可以节省数据库开销,并能有效提高系统的检索速度。  相似文献   

8.
目前对数据流连续查询的研究工作大部分基于滑动窗口,窗口大小固定不变.本文从内存资源有限性与查询结果精确性角度出发,采用可变窗口技术,在缓存中加入窗口控制器,当数据到达缓存时,根据用户提出查询具体问题和数据流速情况,窗口分配算子对其进行窗口大小的划分.使得在内存资源有限的情况下,通过动态改变滑动窗口大小,充分利用系统资源,降低内存使用率的同时,使连续查询的查询结果都在允许的误差范围内,此方法经过验证是可行的.  相似文献   

9.
基于传感器网络的特性,根据查询与簇头节点的数据关联关系,对簇头节点的通信能量消耗和查询响应时间进行了分析,提出了一个估算模型,给出了节省能量优先和查询响应时间优先的算法.性能分析表明,该方法提高了查询效率,降低了传感器网络的能量消耗.  相似文献   

10.
在CBR推荐系统中,基于受限的信息(不完全信息)进行检索,得到可接受的产品是一个重要的、具有挑战性的问题。文章提出了一种发现推荐规则的方法:最优规则推荐算法用来检索事例库。该方法应用于不完全查询中,在发现的规则数量上与NN方法发现的规则基本相同,但这些规则有较高的事例覆盖率。跟决策树方法相比,该方法发现的规则数量少,更容易解释,而且有较高的事例覆盖率。  相似文献   

11.
确定对象在空间数据库研究中受到人们的重视,不确定对象的反向最近邻研究成为研究热点。文中给出不确定对象反向最近邻查询的形式化表示,将其称为可能反向最近邻查询,即为检索所有可能成为给定不确定对象的反向最近邻的可能性大于给定阈值的不确定性对象。提出基于各种剪枝规则的算法,解决多维不确定对象的可能反向最近邻查询问题。  相似文献   

12.
反向最近邻(RNN)查询是空间数据库查询的一个重要的问题。随着无线通讯的发展,时空数据库中反向最近邻查询问题越来越受到关注。本文基于Voronoi图的定义和性质,采用一种不同于Delaunay三角剖分的另外一种三角剖分进行研究,其优势在于对于某个特定点,包含它的三角形的数量较少,查询效率较高。  相似文献   

13.
连续最近邻查询是空间数据库中最重要的查询之一,在地理信息系统和位置定位服务等领域有重要应用.给定一个空间数据集P和查询线段q,连续最近邻查询返回结果<R,T>,其中T是一个间隔,R是这个间隔中所有点的最近邻.已有的连续最近邻查询算法无法实现I/O的优化,为此,提出一种优化的连续最近邻查询方法,该方法具有较高的I/O效率,不仅在减少磁盘访问数量方面进行优化,同时也提高CPU的性能.  相似文献   

14.
《南昌水专学报》2016,(6):99-102
作为人工智能算法的经典算法之一,K最近邻(KNN)在非线性、低维数据时能够取得优越的效果。但是,当维数较高时,现有数据集往往会变得较为稀疏,此时KNN需要大量训练数据才能保证精度。因此,适当的数据降维方法是改进KNN方法的重要手段。先用随机森林对训练数据集的变量进行排序,从而建立一种有效的KNN算法,并采用Boston数据集验证了该模型的有效性。  相似文献   

15.
在欧式空间下反最远邻查询算法的研究已取得了很多成果,但反尼最远邻查询问题还未得到有效解决。本文提出一种反k最远邻查询算法,有效地解决了反足最远邻查询问题,查询算法采用了过滤一提炼的解决模型。在过滤阶段,提出了反远中垂线裁剪方法。该裁剪法是通过做中垂线来过滤不是查询点的反七最远邻的点。在提炼阶段,提出了反远范围尼查询提炼方法。该提炼方法是通过判断对象点是否在设定的范围外来验证该点是否是查询点的反女最远邻。最后通过实验验证了所提算法的有效性。  相似文献   

16.
基于K近邻算法,采用python语言实现手写数字识别.首先对图片进行数据预处理,然后采用K近邻算法对sklearn手写数据集进行分类验证.结果 显示,识别手写数字的准确率高达98.94%,同时实验表明,基于K近邻算法的手写数字识别具有较好应用效果及研究价值.  相似文献   

17.
针对因无线传感器网络节点部署的密集性和随机性造成单一、不变的发射功率无法满足无线传感器网络能量高效的要求,提出基于近邻算法的无线传感器网络功率控制算法(NNPC).该算法中Sink节点保存整个网络拓扑结构的信息,利用多近邻算法评估节点密度,确定最优通信距离.结合Friss自由空间模型和两线地面传播模型计算当前网络最优发射功率,Sink节点广播通知节点采用最优发射功率发送数据.如果节点没有接收到广播包,那么节点采用默认的最大发射功率.仿真结果表明,基于近邻算法的网络功率控制算法能提高整个无线传感器网络的生存时间,节省网络的平均能耗.  相似文献   

18.
针对旁路分析技术对小规模硬件木马检测精度低的问题,提出基于边界Fisher分析的硬件木马检测方法.定义规则式选择近邻样本,以减小样本与其同类近邻样本间距离和增大样本与其异类近邻样本间距离的方式构建投影子空间,在不对数据分布作任何假设的前提下,提取原始功耗旁路信号中的差异特征,实现硬件木马检测. AES加密电路中的硬件木马检测实验表明,该方法能够检测出占原始电路规模0.02%的硬件木马,优于已有的检测方法.  相似文献   

19.
针对人脸描述性脸型特征分类问题,提出一种新的基于主动形状模型和K近邻算法的脸型分类方法。根据主动形状模型方法定位得到的测试样本人脸边缘轮廓点,经归一化后以其围成区域面积作为人脸脸型特征。采用K近邻算法和面型指数实现测试图像的脸型分类。实验结果表明,该方法对人脸姿态变化有一定的鲁棒性,分类结果准确度高且脸型的分类符合人主观描述性判断。  相似文献   

20.
针对传统距离或相似度度量未考虑个体样本对整体样本集影响的情况,对K近邻算法提出了一种相似度改进策略.首先提出了一种新的亲和距离函数,以样本对整体样本集的紧密度和分散度为关注点;其次在亲和距离函数的基础上,提出了一种新的基于紧密度和分散度的亲和相似度函数,并将其作为K近邻算法相似度度量函数;最后通过理论分析及18个数值类型UCI数据集,以5交叉验证模式对所提出亲和相似度函数与传统距离和相似度函数进行验证对比.实验表明,所提出方法是一种有效的相似度策略,且与高效索引算法相结合,可降低在大规模数据集的分类时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号