首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
为更加精确的计算科学数据共享工程中科学元数据间的相似度,提出了一种内容与结构相结合的科学元数据相似度计算方法。在综合分析各个领域元数据特点的基础上,把科学元数据相似度的计算分为两个方面:内容相似度和结构相似度。其中内容相似度基于改进的向量空间模型计算而得,结构相似度包含元数据树的节点相似度和层次相似度两个方面,两者叠加计算出相似度值,并通过实验证明了该方法具有更高的准确性和有效性。  相似文献   

2.
装备元数据进行检索、交换时需要计算相似度,主要对相似度算法进行设计。装备元数据分解为概念和属性两种元素进行元素相似度计算,概念相似度由名称、结构和实例三部分的相似度计算叠加而成,属性相似度则综合考虑名称、定义域和值域的相似度。对各个部分的相似度计算设计了具体的计算公式。装备元数据之间的相似度在元素相似度基础上叠加计算而得出。这种算法能够真实地反映元素和元数据间的相似程度,且实用可行。  相似文献   

3.
基于改进VSM的句子相似度研究   总被引:1,自引:0,他引:1  
向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用.文中提出了一个新的权重概念--领域权重,并利用它改进传统向量空间模型.改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重.在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值.  相似文献   

4.
基于VSM的文本相似度计算的研究*   总被引:15,自引:1,他引:14  
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TDIDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TDIDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。  相似文献   

5.
MD3模型是一种系统的跨本体概念间相似度的计算方法,这种方法无需建立一个集成的共享本体。本文在MD3模型的基础上,充分利用本体对概念的描述信息,重点讨论了跨本体概念间非层次关系相似度的计算,把MD3模型扩展到EMD3模型,使得概念间相似度的计算理论上更全面、更精确。  相似文献   

6.
韩如冰  叶得学 《软件》2012,33(10):103-105
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用.文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法.基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文档中关键词的权重.通过特定领域FAQ的检索测试结果表明,改进的算法很大程度上提高了检索的查准率、查全率.  相似文献   

7.
根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性.  相似文献   

8.
基于文本分类的文档相似度计算   总被引:1,自引:0,他引:1  
如何从成千上万篇文档中找出与指定文档相似的所有文档,首先要做的第一件事就是判断其类别,也就是分类;在判定类别后,再进一步计算,找出同类中所有与指定文档内容相似的文档。由于文档相似度的计算和文本分类过程很相似,所以可以借助指定文档的分类结果,即类别和文档特征向量值,通过进一步计算与同类中其他文档的相似度值,找出超过阂值的文档,即找出与指定目标内容相似的文档。  相似文献   

9.
针对海量网页数据挖掘问题,提出基于向量空间的网页内容相似计算算法和软件系统框架。利用搜索引擎从海量网页中提取中文编码的网页URL,在此基础上提取网页的中文字符并分析提取出中文实词,建立向量空间模型计算网页内容间的相似度。该系统缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为网络信息的分类、查询、智能化等奠定了良好的基础。  相似文献   

10.
提出了一种基于WordNet和GVSM的文本相似度算法,通过语义的路径长度和路径深度计算两个词的语义相似度,结合改进的GVSM模型计算文本相似度,并对基于TFIDF-VSM模型和本文方法进行了比较.实验结果表明,该算法取得了更好的准确率和效率.  相似文献   

11.
基于OAI的数字图书馆中元数据互操作框架   总被引:30,自引:1,他引:30  
提出一种基于最新的元数据互操作协议———OAI的元数据互操作框架。文章给出了框架中各个组件的模块及功能说明,并说明各模块之间的交互。这种框架克服了以前人们所提出的其他集成方法过于复杂、难于实施的缺点。  相似文献   

12.
OAI协议的飞速发展促使了仓储数目的不断增大,导致服务提供者在短时间内无法及时收割数据提供者仓储更新的元数据记录.文中将RSS技术应用到OAI协议中,提出了一种OAI框架中元数据同步问题的解决方法.该方法以XSLT为基础,将数据提供方的元数据记录转换为对应的聚合文件(RSS1.0和RSS2.0),利用RSS技术的即时性、标准统一、易于整合等特点,有效地维护了数据提供方和服务提供方元数据的同步,从而实现了两方信息的同时更新并提高了信息的利用率.  相似文献   

13.
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。  相似文献   

14.
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。  相似文献   

15.
提出了一种基于规则和学习相结合的元数据分类存储的方法,该方法通过统计分析,提取对元数据分类影响较大的通用特征规则,对无法用规则分类的元数据,采用文本学习方法,将元数据记录看成由多个属性字段组成的文本,通过构造分类器实现分类。实验结果表明,采用元数据分类存储方法具有良好的检索性能。  相似文献   

16.
一种基于Muti-agent的个性化网络教学系统框架   总被引:1,自引:0,他引:1  
当前智能教学系统对于用户提出的个性化学习服务实现效果尚不理想。本文将agent技术引入智能教学系统,构建了一种基于多agent的个性化网络教学系统框架,分析了框架内各agent的功能和工作过程,提出了一个学生学习个性化特征提取和处理的模型。通过动态跟踪学习记录,采用向量相似度计算寻找一种与学习者相适应的学习风格,为学生提供个性化的学习服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号