期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王秀慧赵治军王丽珍《计算机工程与设计》2012,33(8):3251-3255

为更加精确的计算科学数据共享工程中科学元数据间的相似度,提出了一种内容与结构相结合的科学元数据相似度计算方法。在综合分析各个领域元数据特点的基础上,把科学元数据相似度的计算分为两个方面:内容相似度和结构相似度。其中内容相似度基于改进的向量空间模型计算而得,结构相似度包含元数据树的节点相似度和层次相似度两个方面,两者叠加计算出相似度值,并通过实验证明了该方法具有更高的准确性和有效性。相似文献

2.

装备元数据相似度计算方法研究

叶永林杨学强傅海洋《计算机仿真》2010,27(4):84-86,95

装备元数据进行检索、交换时需要计算相似度,主要对相似度算法进行设计。装备元数据分解为概念和属性两种元素进行元素相似度计算,概念相似度由名称、结构和实例三部分的相似度计算叠加而成,属性相似度则综合考虑名称、定义域和值域的相似度。对各个部分的相似度计算设计了具体的计算公式。装备元数据之间的相似度在元素相似度基础上叠加计算而得出。这种算法能够真实地反映元素和元数据间的相似程度,且实用可行。相似文献

3.

基于改进VSM的句子相似度研究 总被引：1，自引：0，他引：1

苏小虎《计算机技术与发展》2009,19(8):113-116

向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用.文中提出了一个新的权重概念--领域权重,并利用它改进传统向量空间模型.改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重.在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值. 相似文献

4.

基于VSM的文本相似度计算的研究* 总被引：14，自引：1，他引：14

郭庆琳李艳梅唐琦《计算机应用研究》2008,25(11):3256-3258

文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TDIDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TDIDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。相似文献

5.

本体相似度计算方法研究

张路《网络安全技术与应用》2012,(12):52-54

MD3模型是一种系统的跨本体概念间相似度的计算方法,这种方法无需建立一个集成的共享本体。本文在MD3模型的基础上,充分利用本体对概念的描述信息,重点讨论了跨本体概念间非层次关系相似度的计算,把MD3模型扩展到EMD3模型,使得概念间相似度的计算理论上更全面、更精确。相似文献

6.

基于VSM的权重改进文档相似度算法研究

韩如冰叶得学《软件》2012,33(10):103-105

向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用.文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法.基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文档中关键词的权重.通过特定领域FAQ的检索测试结果表明,改进的算法很大程度上提高了检索的查准率、查全率. 相似文献

7.

基于概念相似度的文本相似计算

彭京杨冬青唐世渭王腾蛟高军《中国科学F辑:信息科学》2009,(5):534-544

根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性. 相似文献

8.

基于文本分类的文档相似度计算 总被引：1，自引：0，他引：1

赵俊杰胡学钢《微型电脑应用》2008,24(12):46-47

如何从成千上万篇文档中找出与指定文档相似的所有文档,首先要做的第一件事就是判断其类别,也就是分类;在判定类别后,再进一步计算,找出同类中所有与指定文档内容相似的文档。由于文档相似度的计算和文本分类过程很相似,所以可以借助指定文档的分类结果,即类别和文档特征向量值,通过进一步计算与同类中其他文档的相似度值,找出超过阂值的文档,即找出与指定目标内容相似的文档。相似文献

9.

基于向量空间的网页内容相似度计算方法研究

何忠秀王霜安礼成《计算机与现代化》2010,(9):53-55,58

针对海量网页数据挖掘问题,提出基于向量空间的网页内容相似计算算法和软件系统框架。利用搜索引擎从海量网页中提取中文编码的网页URL,在此基础上提取网页的中文字符并分析提取出中文实词,建立向量空间模型计算网页内容间的相似度。该系统缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为网络信息的分类、查询、智能化等奠定了良好的基础。相似文献

10.

基于百度百科的词语相似度计算

詹志建梁丽娜杨小平《计算机科学》2013,40(6):199-202

词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题.传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库.提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度.实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理. 相似文献

11.

基于OAI的数字图书馆中元数据互操作框架 总被引：30，自引：1，他引：30

王爱华张铭杨冬青唐世渭《计算机工程与应用》2002,38(1):5-7,41

提出一种基于最新的元数据互操作协议———OAI的元数据互操作框架。文章给出了框架中各个组件的模块及功能说明,并说明各模块之间的交互。这种框架克服了以前人们所提出的其他集成方法过于复杂、难于实施的缺点。相似文献

12.

基于RSS的OAI框架中元数据同步问题解决方法

王秀慧陈立潮谢斌红袁英《计算机技术与发展》2009,19(8):240-242,246

OAI协议的飞速发展促使了仓储数目的不断增大,导致服务提供者在短时间内无法及时收割数据提供者仓储更新的元数据记录.文中将RSS技术应用到OAI协议中,提出了一种OAI框架中元数据同步问题的解决方法.该方法以XSLT为基础,将数据提供方的元数据记录转换为对应的聚合文件(RSS1.0和RSS2.0),利用RSS技术的即时性、标准统一、易于整合等特点,有效地维护了数据提供方和服务提供方元数据的同步,从而实现了两方信息的同时更新并提高了信息的利用率. 相似文献

13.

VSM的权重改进对文档相似度的影响研究

SU Xiao-Hu 《数字社区&智能家居》2008,(10)

向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。相似文献

14.

VSM的权重改进对文档相似度的影响研究

苏小虎《数字社区&智能家居》2008,(4):135-137

向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。相似文献

15.

基于OAI-PMH架构的元数据分类研究

下载免费PDF全文

郑志蕴余正涛《计算机工程》2007,33(13):68-70

提出了一种基于规则和学习相结合的元数据分类存储的方法,该方法通过统计分析,提取对元数据分类影响较大的通用特征规则,对无法用规则分类的元数据,采用文本学习方法,将元数据记录看成由多个属性字段组成的文本,通过构造分类器实现分类。实验结果表明,采用元数据分类存储方法具有良好的检索性能。相似文献

16.

一种基于Muti-agent的个性化网络教学系统框架 总被引：1，自引：0，他引：1

马文龙瞿有甜张金伟《微型电脑应用》2007,23(7):44-46

当前智能教学系统对于用户提出的个性化学习服务实现效果尚不理想。本文将agent技术引入智能教学系统,构建了一种基于多agent的个性化网络教学系统框架,分析了框架内各agent的功能和工作过程,提出了一个学生学习个性化特征提取和处理的模型。通过动态跟踪学习记录,采用向量相似度计算寻找一种与学习者相适应的学习风格,为学生提供个性化的学习服务。相似文献