首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
本文分析了几种传统属性归纳算法,针对它们的不足,提出了基于取样的概念层次挖掘算法,它不仅可以处理不平衡的概念层次,而且得到的泛化规则可以反映实际的数据分布。此外,这种算法具有最优的时间和空间复杂性。实验证明,本文算法是有效、可行的。  相似文献   

2.
本文通过对数据挖掘的几种传统属性归纳算法的分析,发现它们存在以下不足:(1)不能处理不平衡的概念层次;(2)没有考虑实际数据分布对最后的泛化规则的影响。因此,本文提出了基于抽样的概念层次挖掘算法,它先采用抽样方法,对概念层次进行初步调整,然后扫描整个数据文件,利用扫描信息再次调整概念层次,最后通过统计调整后的概念层次的叶子信息就可以得到泛化规则。本算法不仅克服了传统算法的不足,而且具有最优的时间复杂度O(n)和空间复杂度O(c)。  相似文献   

3.
将面向属性的归纳方法应用到网上书店中,通过概念层次技术从用户的注册信息中归纳出用户的访问需求,从而实时主动地为用户提供个性化服务。实验证明该方法对研究用户的兴趣爱好有意义。  相似文献   

4.
在知识发现过程中用户感兴趣的往往是一些高层次、适当概括的简化信息,面向属性的归纳是目前主要的数据归约方法,一般是仅考虑原始数据所提供简单的统计信息.本文提出的基于量化扩展概念格的属性归纳算法,采用概念的爬升进行相应的泛化来完成多层、多属性归纳.与面向属性归纳算法比较,该算法的泛化路径不是唯一的,在量化扩展概念格的哈斯图中容易找到合适的泛化路径和阈值,得到满足用户要求合理的属性归纳结果,以提供用户所需的不同粒度的知识.  相似文献   

5.
面向属性的量化归纳   总被引:6,自引:0,他引:6  
数据简化是数据库中知识发现的一个重要研究方向。面向属性的归纳(AOG)可以用于数据简化。首先从数据简化的角度分析讨论了AOG及其不足;AOG的单一属性阈值控制是布尔型控制,在有例外存在的情况下,可能造成数据过度简化,失去数据简化的意义。其次在AOG的基础上提出了面向属性的量化归纳(QAOG)以弥补AOG的不足;引入记录阈值的概念,用属性阈值和记录阈值同时进行控制,使控制从布尔型变成数量型,对没有例外存在的情况产生与AOG相同的效果,而对有例外存在的情况产生比AOG更好的效果,还给出了一个有效的QAOG算法。  相似文献   

6.
时间序列泛概念树的模糊生成方法   总被引:1,自引:0,他引:1  
该文基于模糊分类方法,根据不同概念层泛化程度的不同,提出了一种时间序列泛概念树自动生成方法,并根据时间序列属性值与不同类间类引力的大小实现了时间序列不同概念层次的不同表示形式,为时间序列知识挖掘的实现打下了一个良好的基础。  相似文献   

7.
一种利用度属性获取本体概念层次的方法   总被引:2,自引:0,他引:2  
通过分析已有的中文本体概念层次获取方法的特点和不足.提出一种利用度属性获取概念层次的方法.首先将概念关系以图的形式表示出来,然后利用反向剪枝算法得出概念所在层次,最后补充并修剪层次关系生成完整的概念层次.从各种参数的对比结果来看,基于VSM(Vector Space Model)且不进行LSI(Latent Semantic Indexing)降维时效果最好,同时也优于目前已有的几种方法.  相似文献   

8.
基于概念的论文相似性检索   总被引:1,自引:0,他引:1       下载免费PDF全文
Web上越来越多的论文给我们提出了一个新的课题:如何检索满足需求的论文。传统的基于查询项匹配检索方法往往无法准确地检索出满足用户需求的论文。这里给出了一种基于概念的论文相似性检索方法,有效地改进了传统的论文检索方法。介绍了一种对论文关键词进行层次聚类的算法,首先把论文关键词聚类为概念,从而生成一个概念树,然后用概念向量表示论文,每篇论文对应一个概念子树。在相似性检索时,采用改进的余弦相似性方法,根据概念向量计算论文的相似性,把与给定论文最相似的论文返回给用户。用这种算法,能很好地对论文进行基于概念的相似性检索。算法克服了基于查询项匹配检索的缺点,实验证明其有较高的查全率和查准率。  相似文献   

9.
一种有效的用于数据挖掘的动态概念聚类算法   总被引:11,自引:0,他引:11  
郭建生  赵奕  施鹏飞 《软件学报》2001,12(4):582-591
概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务.定义了一种基于语义的距离判定函数,结合领域知识对连续属性值进行概念化处理,对于用分类属性和数值属性混合描述数据对象的情况,提出了一种动态概念聚类算法DDCA(domain-baseddynamicclusteringalgorithm).该算法能够自动确定聚类数目,依据聚类内部属性值的频繁程度修正聚类中心,通过概念归纳处理,用概念合取表达式解释聚类输出.研究表明,基于语义距离判定函数和基于领域知识的动态概念聚类的算法DDCA是有效的.  相似文献   

10.
数值型数据的泛概念树的自动生成方法   总被引:35,自引:0,他引:35  
概念层次在数据挖掘中有着重要的作用 .通过自动生成概念层次 ,可有效地提高数据挖掘的效率 ,在不同层次上发现知识 .文中介绍基于云模型的数值型概念表示方法 ,通过云模型的期望值、熵和超熵三个数字特征有效地表达定性概念 ,并实现定性和定量的不确定转换 .通过云变换实现了泛概念树中叶结点的自动生成 ,并自动构造数值型数据的泛概念树 .同时 ,进一步研究了泛概念树中的概念爬升和跳跃的方法 ,为通过数据挖掘发现各层次知识提供了基础 .  相似文献   

11.
梁德翠  胡培 《计算机应用》2011,31(2):493-497
随着系统中数据量剧增,规则太多以及不同决策者对规则有不同层次需求等问题,概念层次提供了一种解决方法。讨论条件属性具有概念层次的情况下,利用粗糙集理论分析属性在不同层次组合下的正域和规则关系,自顶向下提出了概念层次中基于粗糙集的优化可信规则获取的算法。该算法改进了现有的属性约简策略,借助描述子实现属性约简并获取优化可信规则。考虑到层次上正域为空和正域没有新增对象的特殊情况,提高了规则获取的效率。最后通过实例分析说明该算法的可行性。  相似文献   

12.
ESTIMATING DBLEARN'S POTENTIAL FOR KNOWLEDGE DISCOVERY IN DATABASES   总被引:1,自引:0,他引:1  
We propose a procedure for estimating DBLEARN's potential for knowledge discovery, given a relational database and concept hierarchies. This procedure is most useful for evaluating alternative concept hierarchies for the same database. The DBLEARN knowledge discovery program uses an attribute-oriented inductive-inference method to discover potentially significant high-level relationships in a database. A concept forest, with at most one concept hierarchy for each attribute, defines the possible generalizations that DBLEARN can make for a database. The potential for discovery in a database is estimated by examining the complexity of the corresponding concept forest. Two heuristic measures are defined based on the number, depth, and height of the interior nodes. Higher values for these measures indicate more complex concept forests and arguably more potential for discovery. Experimental results using a variety of concept forests and four commercial databases show that in practice both measures permit quite reliable decisions to be made; thus, the simplest may be most appropriate.  相似文献   

13.
概念格是根据数据集中对象与属性之间的二元关系建立的一种概念层次结构,生动简洁地体现了概念之间的泛化和特化关系。利用概念格的这一特性,提出利用概念格理论进行故障诊断时的属性约简。为验证属性约简的正确性,将约简结果送到神经网络中进行故障诊断,诊断结果表明:利用概念格理论所得到的核心属性和相对必要属性可以对现有故障类型进行正确辨识,降低了故障诊断参数的维数,有利于加快诊断算法的运算速度。  相似文献   

14.
在实际形式背景中,属性依赖关系的存在是不可避免的。因此,研究把属性依赖规则应用于概念格构建中是有意义的。通过对属性依赖规则表示和约简的定义,描述了一种新的构建概念格的方法,即把形式背景和约简后属性依赖规则作为输入数据,同时考虑其属性蕴含关系,从而在不需要构建整个概念格的情况下,产生基于属性依赖规则的概念格。其目的在于加快概念格的产生,使其在满足属性依赖规则的情况下,构建概念层次,发现潜在的信息。  相似文献   

15.
传统的粗糙集理论主要是针对单层次决策表的属性约简和决策规则获取研究.然而,现实中树型结构的属性值分类是普遍存在的.针对条件属性具有属性值分类的情况,结合全子树泛化模式,提出一种多层次粗糙集模型,分析决策表在不同层次泛化空间下相关性质.结合基于正区域的属性约简理论,提出属性值泛化约简概念讨论二者之间的关系,同时证明求解泛化约简是一个NP Hard问题.为此,提出一种基于正区域的的启发式泛化约简算法,该算法采用自顶向下逐步细化搜索策略,能够在保持原始决策表正区域不改变的前提下,将决策表所有属性值泛化到最佳层次.理论分析和仿真实验表明,泛化约简方法能提高知识发现的层次和泛化能力.  相似文献   

16.
Several previous systems allow users to interactively explore a large input graph through cuts of a superimposed hierarchy. This hierarchy is often created using clustering algorithms or topological features present in the graph. However, many graphs have domain-specific attributes associated with the nodes and edges which could be used to create many possible hierarchies providing unique views of the input graph. GrouseFlocks is a system for the exploration of this graph hierarchy space. By allowing users to see several different possible hierarchies on the same graph, it allows users to investigate hierarchy space instead of a single, fixed hierarchy. GrouseFlocks provides a simple set of operations so that users can create and modify their graph hierarchies based on selections. These selections can be made manually or based on patterns in the attribute data provided with the graph. It provides feedback to the user within seconds, allowing interactive exploration of this space.  相似文献   

17.
本文针对现有误用检测系统缺少对新攻击样式的适应性问题,从不同概念层次的知识发现角度出发,提出了一种新的误用检测方法。该方法首先利用相关特征选取算法提取每种攻击的最优特征子集,然后通过相似性聚类对攻击样式作概念分层,最后用规则学习算法学习概念级误用检测模型。实验结果表明,该入侵检测方法不但能够提高检测概率
率,实现对新的攻击方式的检测,同时还简化了分类模型。  相似文献   

18.
复杂动态系统中不同层次故障检诊模块的综合设计   总被引:2,自引:0,他引:2  
葛彤  邓建华 《控制与决策》1999,14(5):407-412
为解决复杂动态系统中不同层次故障检诊模块的协调管理和高效运行问题,研究了其综合设计方法。该方法对复杂动态系统层次建模,提出检诊进程概念以描述系统不同层次的故障检诊,同时建立了检诊进程通用模型,使大部分现存检诊算法可方便地纳入其中,实现了不同层次检诊进程的信息交换与综合设计。数字仿真表明,综合设计不但能提高各模块检诊能力,而且可以总体上提高其应付常规方法难以处理的复杂故障情况。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号