首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
面向属性的归纳与概念聚类   总被引:2,自引:0,他引:2  
面向属性的归纳是新近提出的一种广泛用于数据库中的知识发现的方法,提出这种方法与一种机器学习方法--概念聚类之间的紧密联系,并描述如何使用一个概念聚类算法进行面向属性的归纳。  相似文献   

2.
三支概念分析是人工智能领域一个非常重要的研究方向,该理论最大的优势是可以同时研究形式背景中对象“共同具有”和“共同不具有”的属性。众所周知,经过属性聚类生成的新形式背景与原形式背景具有较强的联系,同时原三支概念与经过属性聚类得到的新三支概念也存在紧密的内在联系。为此,进行属性聚类下三支概念的对比研究和分析。首先基于属性聚类提出悲观属性聚类、乐观属性聚类以及一般属性聚类的概念,并研究了这三种属性聚类的关系;然后,通过对比聚类过程与三支概念形成的过程,研究了原三支概念与新三支概念的区别,分别从面向对象和面向属性的角度提出两个最低约束指数,探索了属性聚类对三支概念格的影响,进一步丰富了三支概念分析理论,为可视化数据处理领域提供了可行的思路。  相似文献   

3.
一种启发式的入侵检测警报概念聚类算法   总被引:1,自引:1,他引:0  
熊家军  陈新  李庆华 《计算机工程》2005,31(7):35-36,62
入侵检测系统是一种重要的网络安全防护措施,但是,IDS常常触发大量误警,使得网络安全员不堪重负。基于大量误警是重复发生并且频繁发生这一研究结果,文中运用面向属性归纳的概念聚类方法试图寻找导致IDS产生大量误警的本质原因,实现了一种启发式的入侵检测警报概念聚类算法。该算法能有效识别误警和防止过度概化,减轻网络安全分析员的负担。  相似文献   

4.
一种有效的用于数据挖掘的动态概念聚类算法   总被引:11,自引:0,他引:11  
郭建生  赵奕  施鹏飞 《软件学报》2001,12(4):582-591
概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务.定义了一种基于语义的距离判定函数,结合领域知识对连续属性值进行概念化处理,对于用分类属性和数值属性混合描述数据对象的情况,提出了一种动态概念聚类算法DDCA(domain-baseddynamicclusteringalgorithm).该算法能够自动确定聚类数目,依据聚类内部属性值的频繁程度修正聚类中心,通过概念归纳处理,用概念合取表达式解释聚类输出.研究表明,基于语义距离判定函数和基于领域知识的动态概念聚类的算法DDCA是有效的.  相似文献   

5.
多粒度形式概念分析是近年来形式概念分析领域的一个热点方向。基于属性聚类与属性粒化是两种典型的方法。围绕Wille形式概念分析模型以及面向对象概念分析模型对这两种方法进行了深入的对比研究。首先引入了基于属性聚类的Wille概念分析模型,证明了已有的基于属性粒化的形式概念分析模型是该模型的一种特殊情形。将已有的基于属性粒化的面向对象概念分析模型拓展至基于属性聚类的情形,研究了聚类前后外延集的变化规律,证明了聚类前后外延集仍然保持不变的充分必要条件,所得结果进一步推广了已有文献中的结论。  相似文献   

6.
本文在对COBWEB、CLASSIT等概念聚类系统研究的基础上,提出了一种用数值属性的聚类分划来表示数值属性的方法.这种表示的核心是基于数值属性的取值分布.对于在这种表示下数值属性聚类的相关问题及性质,本文进行了较为详细的讨论.在此基础上,本文给出了一个能统一处理数值属性和符号属性的聚类评价函数.一个基于聚类分划表示方法的概念形成学习系统CFLS(conceptformationlearningsystem)已在微机上实现,并被应用于地质学领域的三叶虫分类问题.本文对CFLS的设计和实现进行了介绍.  相似文献   

7.
在知识发现过程中用户感兴趣的往往是一些高层次、适当概括的简化信息,面向属性的归纳是目前主要的数据归约方法,一般是仅考虑原始数据所提供简单的统计信息.本文提出的基于量化扩展概念格的属性归纳算法,采用概念的爬升进行相应的泛化来完成多层、多属性归纳.与面向属性归纳算法比较,该算法的泛化路径不是唯一的,在量化扩展概念格的哈斯图中容易找到合适的泛化路径和阈值,得到满足用户要求合理的属性归纳结果,以提供用户所需的不同粒度的知识.  相似文献   

8.
空间聚类一直是空间数据挖掘研究的热点之一。现有的聚类方法大都局限于根据空间位置来进行空间聚类的,忽略了空间对象的专题属性,从而导致空间聚类结果有时完全不符合人的空间认知,缺乏合理的解释。为此,综合考虑空间对象的位置和专题属性,提出了一种基于概念格的空间聚类(Concept Lattices BasedSpatial Cluster,CLBSC)方法。该方法通过构建多维专题属性的概念格,简化了空间聚类计算。最后,通过两组实验对CLBSC算法进行了验证分析,研究结果表明:所提出的CLBSC算法是一种具有高可靠性和抗噪性的空间聚类算法。  相似文献   

9.
基于自适应聚类的数据预处理算法Ⅰ   总被引:4,自引:1,他引:4  
提出了KDD的一种逻辑模型。以数据库或数据仓库中的数据为例,根据先验知识或可能的挖掘目标,利用SQL命令滤除无关属性,形成基于某种概念分层的归纳数据库或汇总数据库。针对数据库中的属性,利用非监督学习算法,获取相应聚类,从而形成面向任务的目标数据子集,以保证数据挖掘结果的质量和有效性。  相似文献   

10.
在面向属性归纳(AOG)的数据挖掘中,属性归约及概念归纳都离不开概念层次.而概念层次一般都是先验的,当出现概念层次中没有的新的概念时,无法进行归纳.以属性论为基础的概念相容测度,将概念层次单纯的文字表示转换为其定性基准的表示,给出了名称型属性的概念层次树的动态生成算法.当有新的属性值出现时,可以不用重新生成概念树,只需调用该算法,将新的属性值插入已有概念层次树即可.从而可以让概念归纳与修改概念层次同时进行,使AOG具有了动态归纳的特性.  相似文献   

11.
Data-driven discovery of quantitative rules in relational databases   总被引:9,自引:0,他引:9  
A quantitative rule is a rule associated with quantitative information which assesses the representativeness of the rule in the database. An efficient induction method is developed for learning quantitative rules in relational databases. With the assistance of knowledge about concept hierarchies, data relevance, and expected rule forms, attribute-oriented induction can be performed on the database, which integrates database operations with the learning process and provides a simple, efficient way of learning quantitative rules from large databases. The method involves the learning of both characteristic rules and classification rules. Quantitative information facilitates quantitative reasoning, incremental learning, and learning in the presence of noise. Moreover, learning qualitative rules can be treated as a special case of learning quantitative rules. It is shown that attribute-oriented induction provides an efficient and effective mechanism for learning various kinds of knowledge rules from relational databases  相似文献   

12.
LEARNING IN RELATIONAL DATABASES: A ROUGH SET APPROACH   总被引:49,自引:0,他引:49  
Knowledge discovery in databases, or dala mining, is an important direction in the development of data and knowledge-based systems. Because of the huge amount of data stored in large numbers of existing databases, and because the amount of data generated in electronic forms is growing rapidly, it is necessary to develop efficient methods to extract knowledge from databases. An attribute-oriented rough set approach has been developed for knowledge discovery in databases. The method integrates machine-learning paradigm, especially learning-from-examples techniques, with rough set techniques. An attribute-oriented concept tree ascension technique is first applied in generalization, which substantially reduces the computational complexity of database learning processes. Then the cause-effect relationship among the attributes in the database is analyzed using rough set techniques, and the unimportant or irrelevant attributes are eliminated. Thus concise and strong rules with little or no redundant information can be learned efficiently. Our study shows that attribute-oriented induction combined with rough set theory provide an efficient and effective mechanism for knowledge discovery in database systems.  相似文献   

13.
将面向属性的归纳方法应用到网上书店中,通过概念层次技术从用户的注册信息中归纳出用户的访问需求,从而实时主动地为用户提供个性化服务。实验证明该方法对研究用户的兴趣爱好有意义。  相似文献   

14.
基于属性归纳的中药方剂数据挖掘   总被引:2,自引:0,他引:2  
传统的面向属性归纳技术(AOI)存在概化粗糙及算法效率较低等缺陷。为适应中药方剂数据挖掘的复杂需求,提出基于中药数据驱动的属性关联概化算法;为关联的维度创建概念树,利用关联属性与基准属性的相关性以提高归纳的效率,实现了面向属性关联归纳的数据挖掘系统TCMDBMiner。实验结果表明,新算法较传统算法的归纳概化效率提高了23%以上,挖掘结果符合中医理论。  相似文献   

15.
将面向属性的归纳方法(attribute-oriented induction)用于壁画的展示,提出一种基于知识发现的壁画展示方法。对壁画按内容、位置、时间等强相关维属性,引入本体的层次化描述方式用于对比展示,可帮助研究者更好地获取对象的隐性知识,启发新的类描述和关联规则的发现。结合基于绘画构图学特征的相关度评价方法,可有效地选取研究者关注的内容进行比较和展示。实验以真实的敦煌壁画研究课题为例,验证了本文方法在辅助壁画研究中的有效性。  相似文献   

16.
针对面向属性的归纳方法及粗糙集方法对知识粒性连续性的特点,将两者有机结合,利用面向属性归纳方法对数据进行泛化,再用属性的信息增益技术寻找泛化属性之间的数据依赖关系,能快速地在数据集中挖掘分类规则。将其应用于经典的仿真算例中,仿真结果合理、可靠。  相似文献   

17.
一种基于CBR的网络水产品价格预测方法   总被引:3,自引:0,他引:3  
水产品价格的科学预测对水产业健康可持续发展具有重要作用。提出了一种基于案例推理CBR(Case—Based Reasoning)的水产品价格预测方法,其包括网络数据自动获取、基于概念树的面向属性归纳、案例的生成与表示、案例匹配及相似性计算、案例评价与修正等关键过程。在关键过程研究基础上实现了预测系统,并对网络水产品价格数据进行预测实验。结果表明,该系统能自动采集权威网站水产品价格数据,并能对水产品价格进行有效的分析与预测。  相似文献   

18.
In this article we investigate an attribute-oriented induction approach for acquisition of abstract knowledge from data stored in a fuzzy database environment. We utilize a proximity-based fuzzy database schema as the medium carrying the original information, where lack of precise information about an entity can be reflected via multiple attribute values, and the classical equivalence relation is replaced with the broader fuzzy proximity relation. We analyze in detail the process of attribute-oriented induction by concept hierarchies, utilizing the original properties of fuzzy databases to support this established data mining technique. In our approach we take full advantage of the implicit knowledge about the similarity of original attribute values, included by default in the investigated fuzzy database schemas. © 2007 Wiley Periodicals, Inc. Int J Int Syst 22: 763–779, 2007.  相似文献   

19.
C4.5算法在保险客户流失分析中的应用   总被引:11,自引:0,他引:11  
保持客户和吸引客户是保险公司提高竞争力的关键,目前保险公司对客户流失的分析是粗略的或根据经验来判断。论文利用面向属性归纳和决策树C4.5算法对保险客户基本信息进行分析,找出客户流失的特征,帮助保险公司有针对性地改善客户关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号