共查询到16条相似文献,搜索用时 78 毫秒
1.
为更加精确的计算科学数据共享工程中科学元数据间的相似度,提出了一种内容与结构相结合的科学元数据相似度计算方法。在综合分析各个领域元数据特点的基础上,把科学元数据相似度的计算分为两个方面:内容相似度和结构相似度。其中内容相似度基于改进的向量空间模型计算而得,结构相似度包含元数据树的节点相似度和层次相似度两个方面,两者叠加计算出相似度值,并通过实验证明了该方法具有更高的准确性和有效性。 相似文献
2.
3.
基于改进VSM的句子相似度研究 总被引:1,自引:0,他引:1
苏小虎 《计算机技术与发展》2009,19(8):113-116
向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用.文中提出了一个新的权重概念--领域权重,并利用它改进传统向量空间模型.改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重.在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值. 相似文献
4.
5.
张路 《网络安全技术与应用》2012,(12):52-54
MD3模型是一种系统的跨本体概念间相似度的计算方法,这种方法无需建立一个集成的共享本体。本文在MD3模型的基础上,充分利用本体对概念的描述信息,重点讨论了跨本体概念间非层次关系相似度的计算,把MD3模型扩展到EMD3模型,使得概念间相似度的计算理论上更全面、更精确。 相似文献
6.
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用.文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法.基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文档中关键词的权重.通过特定领域FAQ的检索测试结果表明,改进的算法很大程度上提高了检索的查准率、查全率. 相似文献
7.
根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性. 相似文献
8.
基于文本分类的文档相似度计算 总被引:1,自引:0,他引:1
如何从成千上万篇文档中找出与指定文档相似的所有文档,首先要做的第一件事就是判断其类别,也就是分类;在判定类别后,再进一步计算,找出同类中所有与指定文档内容相似的文档。由于文档相似度的计算和文本分类过程很相似,所以可以借助指定文档的分类结果,即类别和文档特征向量值,通过进一步计算与同类中其他文档的相似度值,找出超过阂值的文档,即找出与指定目标内容相似的文档。 相似文献
9.
10.
11.
基于OAI的数字图书馆中元数据互操作框架 总被引:30,自引:1,他引:30
提出一种基于最新的元数据互操作协议———OAI的元数据互操作框架。文章给出了框架中各个组件的模块及功能说明,并说明各模块之间的交互。这种框架克服了以前人们所提出的其他集成方法过于复杂、难于实施的缺点。 相似文献
12.
OAI协议的飞速发展促使了仓储数目的不断增大,导致服务提供者在短时间内无法及时收割数据提供者仓储更新的元数据记录.文中将RSS技术应用到OAI协议中,提出了一种OAI框架中元数据同步问题的解决方法.该方法以XSLT为基础,将数据提供方的元数据记录转换为对应的聚合文件(RSS1.0和RSS2.0),利用RSS技术的即时性、标准统一、易于整合等特点,有效地维护了数据提供方和服务提供方元数据的同步,从而实现了两方信息的同时更新并提高了信息的利用率. 相似文献
13.
SU Xiao-Hu 《数字社区&智能家居》2008,(10)
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。 相似文献
14.
苏小虎 《数字社区&智能家居》2008,(4):135-137
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。 相似文献
15.