首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
面向属性的归纳与概念聚类   总被引:3,自引:1,他引:3  
伍小荣  谢立宏 《计算机工程》2003,29(5):92-93,123
面向属性的归纳是新近提出的一种广泛用于数据库中知识发现的方法,文章指出这种方法与一种机器学习方法-概念聚类之间的紧密联系,并描述如何使用一个概念聚类算法进行面向属性的归纳。  相似文献   

2.
三支概念分析是人工智能领域一个非常重要的研究方向,该理论最大的优势是可以同时研究形式背景中对象“共同具有”和“共同不具有”的属性。众所周知,经过属性聚类生成的新形式背景与原形式背景具有较强的联系,同时原三支概念与经过属性聚类得到的新三支概念也存在紧密的内在联系。为此,进行属性聚类下三支概念的对比研究和分析。首先基于属性聚类提出悲观属性聚类、乐观属性聚类以及一般属性聚类的概念,并研究了这三种属性聚类的关系;然后,通过对比聚类过程与三支概念形成的过程,研究了原三支概念与新三支概念的区别,分别从面向对象和面向属性的角度提出两个最低约束指数,探索了属性聚类对三支概念格的影响,进一步丰富了三支概念分析理论,为可视化数据处理领域提供了可行的思路。  相似文献   

3.
基于自适应聚类的数据预处理算法Ⅰ   总被引:4,自引:1,他引:4  
提出了KDD的一种逻辑模型。以数据库或数据仓库中的数据为例,根据先验知识或可能的挖掘目标,利用SQL命令滤除无关属性,形成基于某种概念分层的归纳数据库或汇总数据库。针对数据库中的属性,利用非监督学习算法,获取相应聚类,从而形成面向任务的目标数据子集,以保证数据挖掘结果的质量和有效性。  相似文献   

4.
一种有效的用于数据挖掘的动态概念聚类算法   总被引:11,自引:0,他引:11  
郭建生  赵奕  施鹏飞 《软件学报》2001,12(4):582-591
概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务.定义了一种基于语义的距离判定函数,结合领域知识对连续属性值进行概念化处理,对于用分类属性和数值属性混合描述数据对象的情况,提出了一种动态概念聚类算法DDCA(domain-baseddynamicclusteringalgorithm).该算法能够自动确定聚类数目,依据聚类内部属性值的频繁程度修正聚类中心,通过概念归纳处理,用概念合取表达式解释聚类输出.研究表明,基于语义距离判定函数和基于领域知识的动态概念聚类的算法DDCA是有效的.  相似文献   

5.
一种连续条件属性值的决策表的归纳学习方法   总被引:1,自引:0,他引:1  
对由连续条件属性值和离散决策属性值组成的决策表,提出了一种归纳学习方法。把决策表中的连续条件属性值看作一矩阵,进行矩阵的奇异值分解,以确定决策表条件属性的数目。用模糊C均值聚类的方法对连续条件属性值进行不同聚类数目的聚类,得到不同聚类数目下的离散决策表,对这些决策表进行条件属性简化,从而得到不同的条件属性数目。比较矩阵奇异值分解后决策表条件属性的数目和上述不同聚类数目下的离散决策表简化后的条件属性的数目,并考虑决策属性的数目,确定最终的聚类数目。在此基础上,给出了由连续条件属性值和离散决策属性值组成的决策表的归纳学习方法,并验证了其有效性。  相似文献   

6.
一种启发式的入侵检测警报概念聚类算法   总被引:1,自引:1,他引:0  
熊家军  陈新  李庆华 《计算机工程》2005,31(7):35-36,62
入侵检测系统是一种重要的网络安全防护措施,但是,IDS常常触发大量误警,使得网络安全员不堪重负。基于大量误警是重复发生并且频繁发生这一研究结果,文中运用面向属性归纳的概念聚类方法试图寻找导致IDS产生大量误警的本质原因,实现了一种启发式的入侵检测警报概念聚类算法。该算法能有效识别误警和防止过度概化,减轻网络安全分析员的负担。  相似文献   

7.
基于自适应聚类的数据预处理算法I   总被引:1,自引:0,他引:1  
提出了KDD的一种逻辑模型。以数据库或数据仓库中的数据为例 ,根据先验知识或可能的挖掘目标 ,利用SQL命令滤除无关属性 ,形成基于某种概念分层的归纳数据库或汇总数据库。针对数据库中的属性 ,利用非监督学习算法 ,获取相应聚类 ,从而形成面向任务的目标数据子集 ,以保证数据挖掘结果的质量和有效性  相似文献   

8.
基于粗糙集和小生境遗传算法的层次聚类算法   总被引:1,自引:0,他引:1  
目前大部分聚类算法都面向数值属性,针对符号属性的则比较少.提出了一种新的聚类算法 RNGADHCA,该算法将基于共享机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义遗传算法的适应度函数,实验表明,该算法在面向符号属性进行聚类时能取得较好的聚类效果.  相似文献   

9.
一种新的决策树归纳学习算法   总被引:79,自引:1,他引:79  
本文不示例学习的重要分枝--决策树归纳学习进行了分析探讨,从示例学习最优化的角度分析了决策树归纳学习的优化原则,指出了以往的以ID3为代表的归纳学习算法所固有的缺陷,并提出了一种新的基于概率的决策树归纳学习算法PID,PID在扩展属性的选择上仍采用基于信息增益率的方法,但在树上的扩展过程中,采用属性聚类的方法进行树的支合并。PID得到的决策树在树的规模和分类精度上都优于ID3。  相似文献   

10.
多粒度形式概念分析是近年来形式概念分析领域的一个热点方向。基于属性聚类与属性粒化是两种典型的方法。围绕Wille形式概念分析模型以及面向对象概念分析模型对这两种方法进行了深入的对比研究。首先引入了基于属性聚类的Wille概念分析模型,证明了已有的基于属性粒化的形式概念分析模型是该模型的一种特殊情形。将已有的基于属性粒化的面向对象概念分析模型拓展至基于属性聚类的情形,研究了聚类前后外延集的变化规律,证明了聚类前后外延集仍然保持不变的充分必要条件,所得结果进一步推广了已有文献中的结论。  相似文献   

11.
Data-driven discovery of quantitative rules in relational databases   总被引:9,自引:0,他引:9  
A quantitative rule is a rule associated with quantitative information which assesses the representativeness of the rule in the database. An efficient induction method is developed for learning quantitative rules in relational databases. With the assistance of knowledge about concept hierarchies, data relevance, and expected rule forms, attribute-oriented induction can be performed on the database, which integrates database operations with the learning process and provides a simple, efficient way of learning quantitative rules from large databases. The method involves the learning of both characteristic rules and classification rules. Quantitative information facilitates quantitative reasoning, incremental learning, and learning in the presence of noise. Moreover, learning qualitative rules can be treated as a special case of learning quantitative rules. It is shown that attribute-oriented induction provides an efficient and effective mechanism for learning various kinds of knowledge rules from relational databases  相似文献   

12.
LEARNING IN RELATIONAL DATABASES: A ROUGH SET APPROACH   总被引:49,自引:0,他引:49  
Knowledge discovery in databases, or dala mining, is an important direction in the development of data and knowledge-based systems. Because of the huge amount of data stored in large numbers of existing databases, and because the amount of data generated in electronic forms is growing rapidly, it is necessary to develop efficient methods to extract knowledge from databases. An attribute-oriented rough set approach has been developed for knowledge discovery in databases. The method integrates machine-learning paradigm, especially learning-from-examples techniques, with rough set techniques. An attribute-oriented concept tree ascension technique is first applied in generalization, which substantially reduces the computational complexity of database learning processes. Then the cause-effect relationship among the attributes in the database is analyzed using rough set techniques, and the unimportant or irrelevant attributes are eliminated. Thus concise and strong rules with little or no redundant information can be learned efficiently. Our study shows that attribute-oriented induction combined with rough set theory provide an efficient and effective mechanism for knowledge discovery in database systems.  相似文献   

13.
将面向属性的归纳方法应用到网上书店中,通过概念层次技术从用户的注册信息中归纳出用户的访问需求,从而实时主动地为用户提供个性化服务。实验证明该方法对研究用户的兴趣爱好有意义。  相似文献   

14.
基于属性归纳的中药方剂数据挖掘   总被引:2,自引:0,他引:2  
传统的面向属性归纳技术(AOI)存在概化粗糙及算法效率较低等缺陷。为适应中药方剂数据挖掘的复杂需求,提出基于中药数据驱动的属性关联概化算法;为关联的维度创建概念树,利用关联属性与基准属性的相关性以提高归纳的效率,实现了面向属性关联归纳的数据挖掘系统TCMDBMiner。实验结果表明,新算法较传统算法的归纳概化效率提高了23%以上,挖掘结果符合中医理论。  相似文献   

15.
将面向属性的归纳方法(attribute-oriented induction)用于壁画的展示,提出一种基于知识发现的壁画展示方法。对壁画按内容、位置、时间等强相关维属性,引入本体的层次化描述方式用于对比展示,可帮助研究者更好地获取对象的隐性知识,启发新的类描述和关联规则的发现。结合基于绘画构图学特征的相关度评价方法,可有效地选取研究者关注的内容进行比较和展示。实验以真实的敦煌壁画研究课题为例,验证了本文方法在辅助壁画研究中的有效性。  相似文献   

16.
针对面向属性的归纳方法及粗糙集方法对知识粒性连续性的特点,将两者有机结合,利用面向属性归纳方法对数据进行泛化,再用属性的信息增益技术寻找泛化属性之间的数据依赖关系,能快速地在数据集中挖掘分类规则。将其应用于经典的仿真算例中,仿真结果合理、可靠。  相似文献   

17.
一种基于CBR的网络水产品价格预测方法   总被引:3,自引:0,他引:3  
水产品价格的科学预测对水产业健康可持续发展具有重要作用。提出了一种基于案例推理CBR(Case—Based Reasoning)的水产品价格预测方法,其包括网络数据自动获取、基于概念树的面向属性归纳、案例的生成与表示、案例匹配及相似性计算、案例评价与修正等关键过程。在关键过程研究基础上实现了预测系统,并对网络水产品价格数据进行预测实验。结果表明,该系统能自动采集权威网站水产品价格数据,并能对水产品价格进行有效的分析与预测。  相似文献   

18.
In this article we investigate an attribute-oriented induction approach for acquisition of abstract knowledge from data stored in a fuzzy database environment. We utilize a proximity-based fuzzy database schema as the medium carrying the original information, where lack of precise information about an entity can be reflected via multiple attribute values, and the classical equivalence relation is replaced with the broader fuzzy proximity relation. We analyze in detail the process of attribute-oriented induction by concept hierarchies, utilizing the original properties of fuzzy databases to support this established data mining technique. In our approach we take full advantage of the implicit knowledge about the similarity of original attribute values, included by default in the investigated fuzzy database schemas. © 2007 Wiley Periodicals, Inc. Int J Int Syst 22: 763–779, 2007.  相似文献   

19.
C4.5算法在保险客户流失分析中的应用   总被引:11,自引:0,他引:11  
保持客户和吸引客户是保险公司提高竞争力的关键,目前保险公司对客户流失的分析是粗略的或根据经验来判断。论文利用面向属性归纳和决策树C4.5算法对保险客户基本信息进行分析,找出客户流失的特征,帮助保险公司有针对性地改善客户关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号