首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树中的深度,使计算结果更精确。与其他5种语义相似度算法的比较结果表明,该算法能够求得更准确的相似度。  相似文献   

2.
对基于向量空间模型的检索方法进行改进,提出基于本体语义的信息检索模型。将WordNet词典作为参照本体来计算概念之间的语义相似度,依据查询中标引项之间的相似度,对查询向量中的标引项进行权值调整,并参照Word-Net本体对标引项进行同义和上下位扩展,在此基础上定义查询与文档间的相似度。与传统的基于词形的信息检索方法相比,该方法可以提高语义层面上的检索精度。  相似文献   

3.
基于概念统计的英文自动文摘研究   总被引:6,自引:2,他引:6  
文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统。系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分布划分意义块,以意义块为单位抽取文摘,初步解决多主题文章的文摘结构不平衡问题。该文主要介绍概念层次树的构造,主题概念的抽取步骤,句子重要度的计算和意义块的划分算法。测试表明该文提到的方法比传统的基于词频统计的方法有更高的召回率与精确率。  相似文献   

4.
为了提高信息检索的查全率和查准率,经常要处理相似的概念,因此计算概念间的相似度是必要的.概念由对象和属性两部分组成,所以基于概念格相似度计算的也分为两部分:一是利用概念格的层次关系计算对象的相似度,另一部分计算属性的相似度.其次,概念间的相似度与概念在概念格中的深度有关,计算时利用深度对结果加以修正.计算模型利用了概念较为完整的信息,计算结果与人工判断基本吻合.  相似文献   

5.
数值型数据的泛概念树的自动生成方法   总被引:35,自引:0,他引:35  
概念层次在数据挖掘中有着重要的作用 .通过自动生成概念层次 ,可有效地提高数据挖掘的效率 ,在不同层次上发现知识 .文中介绍基于云模型的数值型概念表示方法 ,通过云模型的期望值、熵和超熵三个数字特征有效地表达定性概念 ,并实现定性和定量的不确定转换 .通过云变换实现了泛概念树中叶结点的自动生成 ,并自动构造数值型数据的泛概念树 .同时 ,进一步研究了泛概念树中的概念爬升和跳跃的方法 ,为通过数据挖掘发现各层次知识提供了基础 .  相似文献   

6.
针对有限空间下如何快速维护概念格的问题,提出一种消减形式背景中冗余二元关系的概念格维护算法。传统的算法删除冗余关系后需要重新构造概念格,这种方式较为费时。而所提算法能够在原始概念格的基础上直接调整得到新概念格的方法,可以处理任意位置的二元关系消减的情况。它采用自底向上广度优先方式遍历格节点,首先根据当前节点是否同时包含冗余关系对象和冗余关系属性,将当前节点分为受影响的节点和不变节点;然后根据当前节点与父子节点的外延和内涵的关系,再将受影响的节点细分为4类,即减对象节点、减属性节点、分割节点、删除节点;最后根据父子节点的类型更新边。实验结果表明,在一定程度上与传统算法相比,所提算法能够获得更好的时间性能。  相似文献   

7.
给出了一个新的用于计算WordNet中概念的语义相似度的IC(信息内容)模型。该模型以WordNet的is_a关系为基础,只通过WordNet本身结构就可求出WordNet中每个概念的IC值,而不需要其他语料库的参与。该模型不仅考虑了每个概念所包含的子节点的个数,而且将该概念所处WordNet分类树中的深度引入到模型当中,使得概念的IC值更为精确。实验结果显示将该模型代入到多个相似度算法当中,可以明显提高这些算法的性能。  相似文献   

8.
提出一种新型Overlay网络服务发现机制,该机制充分利用概念之间的语义相似性,从语义概念树模型扩展概念相似度的计算,并将该语义概念树模型应用到Overlay网络服务发现机制的研究中。实验证明,该语义概念模型能够根据用户的想法和查询词条的内在含义进行相近语义短语的查找,实现匹配机制的语义化,提高了服务发现的查准率。  相似文献   

9.
Automatic generation of concept hierarchies using WordNet   总被引:2,自引:1,他引:1  
This paper examines and proposes the automatic generation of concept hierarchies using WordNet. Existing researches have mostly explored the utilization of concept hierarchies, but have not addressed the prohibitive cost occurred in building large hierarchies manually. Several studies have examined the automatic generation of concept hierarchies for the numerical type data from a database. However, very little is known about the automatic generation of concept hierarchies for the nominal type data from a database, which is the subject of this paper. We propose the WordNet library method that first eliminates the ambiguity of the senses of nominal data values, constructs the concept hierarchy by overlapping the hypernym of the remaining senses, and lastly adjusts the resultant concept hierarchy to the preference of users. The proposed method is tested with a faculty employment database of a university. The automatic generation of hierarchies turns out to save efforts of experts or designers who build the concept hierarchies, and makes the hierarchy more objectively built than it is manually done.  相似文献   

10.
冯永  张洋 《计算机应用》2012,32(1):202-205
介绍了传统的基于距离的相似度计算方法,针对其在距离计算中包含语义信息不充足的现状,提出了一种改进的使用WordNet的基于概念之间边的权重的相似性度量方法。该方法综合考虑了概念在词库中所处层次的深度和密度,即概念的语义丰富程度,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题。实验结果表明,所提方法在Rubenstein数据集上与人工判断有着0.9109的相关性,与其他经典的相似性计算方法相比有着更高的准确性。  相似文献   

11.
基于形式概念的语义网本体的构建与展现   总被引:4,自引:0,他引:4  
作为语义网基础的本体是共享概念模型的明确的形式化规范说明,它提供一种让计算机可以交换、搜寻和认同文字信息的方式。有效地构建、展现本体成为应用本体的关键问题,然而,现有构建本体的各种方法都在不同方面存在着限制。经过分析比较,本文采用形式概念分析理论构造本体阶层来弥补缺陷,并结合机率模式展现本体,用于表达概念之间及概念、资料间的相关性,利用文件与概念的相关性排序结果,以便于用户找到最相关的信息,从而有效地提高了信息查找的效率。本文通过实例来演示本体的构造与表达。  相似文献   

12.
概念格的内涵缩减研究   总被引:2,自引:2,他引:0       下载免费PDF全文
利用概念格作为属性约简的数据模型,对概念格上的父子关系和内涵属性来源进行了分析:在概念格中任意若干个概念如果存在共同的子概念,那么只存在一个共同的子概念;概念的属性有两种来源,其一是继承的父节点的属性,其二是概念细化过程中增加的属性。相应地提出了两条内涵缩减的规则:如果一个节点只有一个父节点,那么其内涵缩减来源于它的内涵与父节点内涵的差集;如果一个节点有两个或两个以上的父节点,那么其内涵缩减来源于任意两个父亲节点属性的并集。然后对两条规则进行了证明,并设计了计算内涵缩减的算法。  相似文献   

13.
结合概念语义空间的语义扩展技术研究   总被引:2,自引:0,他引:2  
王磊  黄广君 《计算机工程与应用》2012,48(35):106-109,193
查询扩展是在原查询词的基础上加入相关的词或者词组,以克服自然语言的"二义性"问题,改进查询意愿的描述。在概念语义空间中进行查询词扩展,可以充分挖掘出查询词之间的关联程度,在整体上把握查询意愿。利用WordNet语义词典中的上下文关系和相似度关系为各个原始查询词构建语义树,并将这些语义树向上溯源建立完整的概念语义空间,以共现信息为特征参数对扩展源中的词进行筛选,以避免过度扩展引起查询语义漂移。还引入动态观察窗口加权模型,以强化共现信息对单词之间关联度的表示。实验结果表明,该扩展算法比传统伪相关反馈算法的扩展质量有明显提高。  相似文献   

14.
概念格理论是知识处理与分析的一种有力工具,在知识发现和数据挖掘等众多领域有着重要的应用。引入了概念相似度新的计算方法,由对象和属性共同确定概念之间的相似程度,进而产生概念邻域,并根据概念间相似程度来控制概念邻域的大小,删除不必要的节点,从而控制面向对象概念格中节点的个数,实现面向对象概念格的压缩和知识库简化。示例表明,当参数的值较小时,压缩效果明显。  相似文献   

15.
中文概念词典的结构   总被引:26,自引:5,他引:26  
中文概念词典(Chinese Concept Dictionary ,简称CCD)是北京大学计算语言学研究所开发的与WordNet兼容的汉语语义词典。本文着重描述了CCD的结构:CCD中的“概念”用同义词的集合定义,CCD的主关系——概念之间的继承关系(即上下位关系)和一些附加关系使得CCD形成一个概念网络,其上的演绎规则是严格形式化了的,可应用于中文的语义分析。  相似文献   

16.
相对约简格作为简化的概念格,在数据挖掘和知识发现等领域具有广泛的应用.相对约简格的构造在其应用过程中是一个主要问题.本文提出了采用树结构对相对约简格节点进行组织,研究了基于属性的相对约简格渐进式构造算法.相对约简格节点的树结构组织可以约束更新格节点、产生子格节点及新生格节点的子结点的搜索范围,从而可以有效地减少算法的执行时间.该算法不仅为相对约简格的构造提供了一种方法,还解决了在已构造好相对约简格的前提下,增加属性所带来的更新问题.在随机生成的数据集上进行的实验测试表明,本算法的时间性能更优越.  相似文献   

17.
基于概念语义的用户兴趣模型的研究   总被引:1,自引:0,他引:1  
用户建模是个性化服务的关键技术。从抽取概念集合出发,结合预先定义的语义概念层次树,通过机器学习建立概念层次树中各分枝的规范化表示,挖掘蕴藏在文档中的主题语义概念集合,并将概念映射到概念层次树中,从而建立用户兴趣模型。为了检验提出的模型,分别从主题语义概念集合的抽取和信息过滤方面进行了实验。测试结果表明,具有较好的用户建模性能。  相似文献   

18.
Segmenting customers by transaction data with concept hierarchy   总被引:1,自引:0,他引:1  
The segmentation of customers is crucial for an organization wishing to develop appropriate promotion strategies for different clusters. Clustering customers provides an in-depth understanding of their behavior. However, previous studies have paid little attention to the similarity of different items in transaction. Lack of categories and concept levels of items, results from item-based segmentation methods are not as good as expected. Through employing a concept hierarchy of items, this study proposes a segmentation methodology to identify similarities between customers. First, the dissimilarity between transaction sequences is defined. Second, we adopt hierarchical clustering method to segment customers by their transaction data with concept hierarchy of consumed items. After segmentation, three cluster validation indices are used for optimizing the number of clusters of customers. Through the compassion of normalized index, the segmentation method proposed by this study rendered better results than other traditional methods.  相似文献   

19.
通过对概念格渐进式构造过程的分析,采用树结构对概念格节点进行组织,研究了利用这种树状组织的渐进式生成属性优先的概念格的构造算法。并结合实例说明了概念格的树结构组织在属性优先的渐进式生成概念格时,能有效地缩小产生子格节点的搜索范围和新增格节点的父节点和子节点的搜索范围,从而能快速生成概念格。  相似文献   

20.
韩仙玉  姜瑛 《计算机应用》2011,31(6):1487-1490
为了提高构件测试信息的检索效率,针对现有本体语义相似度计算方法作用于构件测试本体时容易出现漏检的问题,提出一种结合本体概念和属性的综合语义相似度计算方法。该方法首先结合概念的结构、层次、子代节点个数和祖先节点个数等因素计算概念相似度;然后,结合属性的概念相似度和数据类型相似度计算属性相似度;最后,综合概念相似度和属性相似度计算本体的语义相似度。实验表明该方法可以有效应用于构件测试领域及其他领域的信息检索。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号