首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
目前对于查询相似度的计算通常是从比对检索结果与查询式的相似度来考虑。本文提出一种基于贝叶斯分类的算法来计算XML查询结果相似度。在计算出每个检索结果文档与查询式相似度的基础上,使用贝叶斯分类器将XML检索文档分类成相关与不相关两个集合,再由计算相关文档与不相关文档的相似度来决定最终的相似度值。最后,通过实验分析表明,在不影响查全率的前提下,这样得到的相似度计算精度比传统方法高15%左右,有效地提高了检索性能。  相似文献   

2.
传统基于用户的协同过滤推荐算法在计算用户相似性时经常面临数据稀疏的问题,同时忽略了不同评分项目之间的差异。针对这些问题,提出一种基于FunkSVD矩阵分解和相似度矩阵的推荐算法。利用用户评分数据与物品标签数据计算出用户的相似度矩阵;利用FunkSVD对得到的相似度矩阵进行矩阵分解,生成新的用户相似度矩阵;根据用户之间评分数据对两个相似度矩阵中的用户相似度加权组合,并生成用户的综合相似度矩阵来对用户进行评分预测。经过Movielens数据集的实验表明,该算法提高了预测的准确性,优于传统的推荐算法。  相似文献   

3.
本体算法中相似度矩阵的学习   总被引:1,自引:0,他引:1  
本体图中顶点之间的相似度计算是各类本体算法的本质所在.本体图中各个顶点对的相似度组成本体相似度矩阵,因此得到一个最优相似度矩阵是本体应用的实质.本文提出一种通过计算距离矩阵来得到本体相似度矩阵的方法,该方法着眼于降维过程的稀疏化和解的光滑性.从样本集得到相似顶点对集合S和不相似度顶点对集合D,由此得到三元组Γ.将Γ的信息融入到计算模型中,进而使得距离矩阵保持了原本体图中顶点间的距离结构特征.借鉴凸最小最大优化模型的光滑逼近法,得到距离矩阵计算模型的求解策略.最后,通过两个具体实验表明,本文所给的相似度矩阵计算方法对于特定应用领域中的本体相似度计算和不同本体间建立本体映射具有较高的效率.  相似文献   

4.
张丙奇  白硕  赵章界 《计算机工程》2005,31(11):25-27,126
XML数据的大量出现为信息检索、数据挖掘、智能信息处理提供了机遇和挑战,而相似度计算是XML文档检索、挖掘和深层次智能处理的基础,对相似度计算进行研究具有非常重要的意义。在对XML数据特征进行深入分析的基础上,提出了一种递归相似度计算方法,实验结果表明该方法具有较好的效果。  相似文献   

5.
基于核矩阵学习的XML文档相似度量方法   总被引:6,自引:0,他引:6  
杨建武  陈晓鸥 《软件学报》2006,17(5):991-1000
XML文档作为一种新的数据形式,成为当前的研究热点.XML文档间相似度的计算是XML文档分析、管理及文本挖掘的基础.结构链接向量模型(structuredlink vector model,简称SLVM)是一种综合考虑XML文档结构信息与内容信息进行XML文档相似度量的方法.体现XML文档结构单元关系的核矩阵在结构链接向量模型中扮演着重要角色.为自动捕获XML文档结构单元关系,提出了两种核矩阵的学习算法,分别是基于支持向量机(support vector machine,简称SVM)的回归学习算法和基于矩阵迭代的学习算法.相似搜索实验对比结果表明,基于核矩阵学习方法的XML文档相似度量方法的准确性明显优于其他方法.进一步实验表明,基于矩阵迭代学习的核矩阵学习算法与基于支持向量机的回归学习算法相比,不仅具有更高的准确性,而且所需训练文档更少、计算代价更小.  相似文献   

6.
基于矩阵相似度的图象特征抽取和识别   总被引:5,自引:1,他引:4  
  相似文献   

7.
XML文档聚类是高效管理XML文档的重要手段,XML文档相似度计算正是其中的关键步骤。pq-gram算法是解决XML文档相似度计算问题的有效手段,但忽略了XML文档结点的有序性。带权重的pq-gram算法是在此基础上,依据XML文档的结构性,首先为结点赋予相应权重,然后基于结点的权重对pq-gram赋予权重,最后将设定的权重应用到XML文档相似度计算中。实验结果表明,带权重的pq-gram算法更好地描述结点在XML文档相似度计算中的贡献度,提高了XML文档相似度计算的精度。  相似文献   

8.
由于对文档进行分类有时并不能有效地满足信息检索的需要,文本提出了一种在文本分类的基础上的关键词分类算法,用于优化基于多关键词组合的搜索系统。  相似文献   

9.
词向量使用低维稠密向量表示词,通过向量运算能够反映词间关系,被广泛应用于自然语言处理任务。对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性,两个数据集下词向量质量最高提升0.2896和0.1801。中心化能够提升降维前相似度矩阵质量,进而提升词向量质量。  相似文献   

10.
经分析研究开源的Lucene系统架构以及特殊xml数据源,针对Lucene搜索得分公式的不足,提出了结合词项位置和二次检索的公式,设计一种文本搜索系统;并以提高检索性能、相似性搜索的准确率、索引的空间效率和支持查询的时间效率为目标进行实验,最后通过部署Tomcat服务器实现.经实验验证,改进的系统较之于原Lucene系统提高了建立索引效率、查询效率、准确率.  相似文献   

11.
XML文档结构相似测度研究   总被引:2,自引:0,他引:2  
为了满足基于Web的XML数据信息的近似搜索、信息分类以及数据交换的需求,提出一种新的有效地鉴定XML文档间结构相似度的标准。该标准包含了XML文档的结构信息和节点嵌套的语义信息,可以有效地给出XML文档间的结构相似测度。通过实验证明该标准具有高度的准确性和有效性。  相似文献   

12.
闵勇  黄上腾 《计算机仿真》2005,22(1):153-155
高效的存储方法是实现一个高性能XML数据库的关键。该文提出一种基于访问频率的XML文档存储方法。该方法基于XPath模型,通过分析XML查询条件中的路径表达式来获得各位置路径的访问频率,然后根据文档中各节点的位置路径的访问频率来决定该节点的存储策略,使XML文档的存储更加符合实际查询的需要。  相似文献   

13.
图像相似度计算是众多视觉任务中不可或缺的关键环节,因此文中提出基于相似矩阵自适应加权的实景图像相似度计算方法.首先将图像划分为均匀图像块,基于卷积神经网络构建各图像块的特征描述符.然后计算各图像块间的相似度,组成相似矩阵.最后分析相似矩阵中的数据分布,确定图像对包含同一场景的概率,根据相似矩阵中的数据差异计算各单元相似度权值,确定整幅图像的相似度.实验表明,相比已有方法,文中方法在图像检索应用中鲁棒性更高,可以有效解决即时定位与地图构建中的闭环检测问题.  相似文献   

14.
基于模式的XML文档相似度算法   总被引:1,自引:0,他引:1       下载免费PDF全文
孙霞  程宏斌 《计算机工程》2010,36(21):54-56
提出一种基于XML模式的文档相似度算法,其中,XML模式间的相似度是XML文档聚类的重要依据,元素是XML模式的主体,模式的相似度由元素相似度组成,该算法综合考虑XML模式中元素的结构和语义信息,进一步提高计算相似度的精度。另外,该算法通过计算XML模式间的相似度,可以降低算法的复杂度,提高聚类的准确性,易于提取聚簇的通用XML模式。  相似文献   

15.
XML数据的存储实现研究   总被引:4,自引:0,他引:4  
吴敏  徐德智 《计算机工程》2003,29(15):25-26,47
XML正在迅速成为WWW上的信息交换、表示和存储手段之一。文章基于离散模式的XML数据库系统(DISXDBS)研发工作的存储研究部分,简明扼要地介绍了当前XML数据的主要存储技术,探讨了保证高效查询的XML数据的存储方法,最后给出了实验分析。  相似文献   

16.
XML数据库存储策略综述   总被引:9,自引:0,他引:9  
XML是SGML一个子集,本质上是一种特殊的SGML标记语言.XML已经成为Internet上数据表示和数据交换的新标准,被认为是最有前途的一种半结构化数据组织方式.XML的重点是管理信息的数据本身,而不是数据的样式.XML这种明确的分工导致的将是更高效的Web程序设计,更快的搜索引擎、更统一的数据表示和更方便的数据交流的出现.因为底层的存储表达对上层的查询处理和优化有着重要的性能影响,所以如何存储XML文档才是最好的方式已经成为一个重要问题.本文介绍了几种XML数据库的存储策略,并对每种存储策略进行了描述、分析,然后对几种存储策略进行了性能和优缺点的比较.  相似文献   

17.
基于XML Schema的XML存储   总被引:6,自引:0,他引:6  
郝春辉  邹静 《计算机工程与应用》2006,42(11):173-175,204
文章介绍了一个在关系数据库中,基于XMLSchema的XML存储方案。描述了一个以树模型为模型,XMLSchema为模式的XML数据库的存储系统。首先给出了在关系数据库中存储XMLSchema的方法,在此基础上,又给出了存储XML文档的方法。与通常的XML分解存储方案不同之处在于,在该方案中,XMLSchema被保存到数据库中,未作模式映射,避免了模式映射通常会带来的数据丢失和数据要分散到多个关系表中的问题;对XML文档的存储和查询都是基于XMLSchema的;并且由于所有基于同一个模式的XML文档共享该模式的结构,不必对结构信息进行重复存储,减少了存储空间;最后,由于我们为每一个元素赋予了一个唯一ID值,在进行查询的时候,可以利用该ID值进行定位,具有和XPath表达式相同的作用,但是更为简便。  相似文献   

18.
基于关系数据库的XML存储技术评述   总被引:26,自引:1,他引:26  
XML近来已成为科学与业务应用中数据表示的标准以及Web上应用间数据交换的标准。为实现XML的潜能,XML的有效存储是一个必须首先要解决的技术环节。在关系数据库中存储XML数据是一种可选的策略。文章简要综述了各类典型的XML关系存储方法,并对这些方法进行了评述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号