首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在知识发现过程中用户感兴趣的往往是一些高层次、适当概括的简化信息,面向属性的归纳是目前主要的数据归约方法,一般是仅考虑原始数据所提供简单的统计信息.本文提出的基于量化扩展概念格的属性归纳算法,采用概念的爬升进行相应的泛化来完成多层、多属性归纳.与面向属性归纳算法比较,该算法的泛化路径不是唯一的,在量化扩展概念格的哈斯图中容易找到合适的泛化路径和阈值,得到满足用户要求合理的属性归纳结果,以提供用户所需的不同粒度的知识.  相似文献   

2.
面向属性归纳方法是面向查询的、基于泛化的联机数据分析处理技术。研究使用SQL语句直接实现广义关系表,简化面向属性归纳方法的实现。  相似文献   

3.
面向属性归纳方法是面向查询的、基于泛化的联机数据分析处理技术。研究使用SQL语句直接实现广义关系表.简化面向属性归纳方法的实现。  相似文献   

4.
面向属性的归纳与概念聚类   总被引:2,自引:0,他引:2  
面向属性的归纳是新近提出的一种广泛用于数据库中的知识发现的方法,提出这种方法与一种机器学习方法--概念聚类之间的紧密联系,并描述如何使用一个概念聚类算法进行面向属性的归纳。  相似文献   

5.
面向属性的归纳与概念聚类   总被引:3,自引:1,他引:3  
伍小荣  谢立宏 《计算机工程》2003,29(5):92-93,123
面向属性的归纳是新近提出的一种广泛用于数据库中知识发现的方法,文章指出这种方法与一种机器学习方法-概念聚类之间的紧密联系,并描述如何使用一个概念聚类算法进行面向属性的归纳。  相似文献   

6.
大量的入侵检测警报使得IDS的功能无法得到有效发挥。本文用面向对象属性的归纳方法实现概念聚类算法,并对其改进后应用到入侵检测警报研究中,以减少误警数量。  相似文献   

7.
本文分析了几种传统属性归纳算法,针对它们的不足,提出了基于取样的概念层次挖掘算法,它不仅可以处理不平衡的概念层次,而且得到的泛化规则可以反映实际的数据分布。此外,这种算法具有最优的时间和空间复杂性。实验证明,本文算法是有效、可行的。  相似文献   

8.
在面向属性归纳(AOG)的数据挖掘中,属性归约及概念归纳都离不开概念层次.而概念层次一般都是先验的,当出现概念层次中没有的新的概念时,无法进行归纳.以属性论为基础的概念相容测度,将概念层次单纯的文字表示转换为其定性基准的表示,给出了名称型属性的概念层次树的动态生成算法.当有新的属性值出现时,可以不用重新生成概念树,只需调用该算法,将新的属性值插入已有概念层次树即可.从而可以让概念归纳与修改概念层次同时进行,使AOG具有了动态归纳的特性.  相似文献   

9.
李波 《计算机科学》2002,29(7):87-89
一、引言属性归纳算法的出现主要有以下几个原因。首先,虽然某些规律,如关联规则可以在基本概念层上发现,但是一些更让人感兴趣的规律一般只在更高的概念层上才能发现,并且表达得更简洁一些。因此有必要将数据库中的基本数据泛化到相对高的概念层上才能更有效地挖掘数据。其次,由于自发的挖掘会产生太多的规则而失去重点,因此一般推荐由用户来提出数据挖掘的要求,这样可以有限制地搜索相关的数据集来挖掘出相关的数据。最后,存在某些知识背景可利用,如概念层次。这不仅提高了挖掘的效率,而且可以反映出用户在挖掘过程中的一些控制,这样可以更有利于得到期望的泛化结果。  相似文献   

10.
寻呼系统中的用户资料库数据具有多维性,如用户类型,开户时间,开户地点,联网方式,速率,BP机类型等。对此类数据的多维分析有助于了解系统负载,资源使用,用户分布,利润等情况。为此,论文运用概念描述的方法对广东省某寻呼台的用户资料库进行了数据挖掘。对寻呼台的领导层制定寻呼台的发展策略可以起到积极的作用。  相似文献   

11.
针对面向属性的归纳方法及粗糙集方法对知识粒性连续性的特点,将两者有机结合,利用面向属性归纳方法对数据进行泛化,再用属性的信息增益技术寻找泛化属性之间的数据依赖关系,能快速地在数据集中挖掘分类规则。将其应用于经典的仿真算例中,仿真结果合理、可靠。  相似文献   

12.
基于策略模式的中医数据挖掘平台   总被引:1,自引:0,他引:1  
随着数据挖掘技术的发展和中医信息化的逐渐深入,很多数据挖掘方法被应用到中医研究领域。针对面向对象软件设计模式中的策略模式在数据挖掘科研软件平台设计开发上的应用进行了研究,并提出了平台设计概要。在此基础之上,提出了一种中医数据挖掘研究的思想方法:将中医问题(数据)封装、将数据挖掘方法(算法)封装,实现统一的接口,从而实现在某一类中医问题中尝试不同的数据挖掘方法、将某一种数据挖掘方法应用于不同的中医问题。基于上述思想方法,实现了中医数据挖掘平台,用于中医相关领域的数据挖掘研究。  相似文献   

13.
中文语义相关度计算模型研究   总被引:2,自引:1,他引:2       下载免费PDF全文
现有的中文语义相关度计算模型对相关度的定义并不明确和统一,且计算方法多以相似度计算为基础,导致应用语义相关度存在局限。提出了一个新的语义相关的定义,认为两个词所表达的概念之间,如果存在用类似“知网”的知识描述体系所描述的语义关系,那么这两个概念之间就是语义相关的。通过挖掘这些直接或间接的关系,提出了一种新的语义相关度的计算模型,适用于所有类似知网的知识体系中语义相关度的计算。最后将该计算模型应用于词义排歧,验证了该计算模型的有效性。  相似文献   

14.
基于策略模式的中医数据挖掘平台的设计与研究   总被引:1,自引:0,他引:1  
随着数据挖掘技术的发展和中医信息化的逐渐深入,很多数据挖掘方法被应用到中医研究领域.本文针对面向对象软件设计模式中的策略模式在数据挖掘科研软件平台设计开发上的应用进行了研究,并提出平台设计概要.在此基础之上,提出一种中医数据挖掘研究的思想方法:将中医问题(数据)封装、将数据挖掘方法(算法)封装,实现统一的接口,从而实现在某一类中医问题中尝试不同的数据挖掘方法、将某一种数据挖掘方法应用于不同的中医问题.基于上述思想方法,实现了中医数据挖掘平台,用于中医相关领域的数据挖掘研究.  相似文献   

15.
中药特性信息数据挖掘系统中的预处理设计   总被引:4,自引:1,他引:3       下载免费PDF全文
中药数据的不规范,使预处理成为数据挖掘系统中的一个重要过程。该文开发中药特性信息数据挖掘系统,介绍系统结构与挖掘流程,分析中药数据的特征,对数据进行预处理,包括过滤噪声数据、中医药术语规范化、缺损数据处理、剂量单位规范化、作用度规一化、功效量化等。  相似文献   

16.
介绍了一种实现方剂知识信息形式化计算的方法,并进行了量化的表达,在此基础上运用基于SVM的模式识别系统,以“方剂分类”为目标进行实验,其结果符合或接近中医学的普遍认识,获得了满意的效果。实验表明,机器学习技术是挖掘中医处方思维模式特征的可行方法,有很好的应用前景。  相似文献   

17.
在中医药领域挖掘药组频繁项集时发现,尽管有些项集的支持度比人们需要的频繁项集的支持度高很多,但这些项集并不是人们感兴趣的,即过分频繁反而变得平凡.本文引入支持度区间的概念,提出了适合中药数据挖掘的二维TCM-FP森林结构及其建树算法.在针对疾病症状的中药药组挖掘过程中,采用优化的搜索策略开发了基于支持度区间的TCMA维间最大频繁项集挖掘算法.这种算法既缩小了挖掘的范围又提高了规则的意义,并且具有较高的执行效率.  相似文献   

18.
基于多维数据分析的中医主药挖掘技术   总被引:2,自引:0,他引:2  
采用数据挖掘技术研究了中药主药分析。提出并实现了基于多维数据分析的主药挖掘算法,在该算法中引入干扰药物过滤算子以及药对算子。以脾胃方剂库为对象,分别使用基于相对剂量的主药分析算法和基于多维数据分析的主药挖掘算法进行了实验。实验表明,加入干扰药物过滤算子以及药对算子的基于多维数据分析的主药挖掘算法能够有效地提高主药分析的正确率。 对  相似文献   

19.
李校林  杜托  刘彪 《计算机应用》2017,37(8):2357-2361
针对现有的频繁模式挖掘算法存在建树复杂、挖掘效率低等问题,提出一种基于构造链表(B-list)的频繁模式挖掘(BLFPM)算法。BLFPM使用一种新的数据结构B-list表示频繁项集,通过连接两个k-1-频繁项集的B-list可以快速得到k-项集的支持度,避免了多次扫描数据库;针对连接两个B-list时间复杂度高的问题,给出了一种线性时间复杂度的连接方法,提高了BLFPM的时间效率;同时,BLFPM采用集合枚举树代表搜索空间,并使用子集非频繁剪枝策略,减小了频繁模式挖掘的搜索空间,提高了算法的执行速度。实验结果表明,与NSFI算法和prepost算法相比,BLFPM的时间效率提高约12%到29%,空间效率提高约10%到24%,对稀疏数据库或稠密数据库进行频繁模式挖掘均可以得到良好的效果。  相似文献   

20.
黄光球  何通  陆秋琴 《计算机应用》2016,36(12):3262-3268
针对系统动力学(SD)模型既无法表达延迟具有随机性,又无法描述不同状态之间存在的条件转移,以及随机Petri网(SPN)本身存在计算能力不足等问题,首先,将SPN进行扩展,提出了随机函数Petri网(SFPN)模型;然后,将SFPN与SD相结合,提出了一种SFPN-SD模型。因SFPN模型中的变迁本身能精确描述随机延迟,故解决了SD模型存在的第一个问题;因SFPN模型中的条件弧能表达库所之间的有条件转移,故解决了SD模型存在的第二个问题;最后,在SPN的库所和变迁中定义一些状态变量及其状态转移方程,而状态变量及其状态转移方程就是SD模型中的水平变量、辅助变量、速率变量、水平方程和速率方程的不同解释,状态转移方程可以实现复杂的计算,于是解决了SPN模型的计算能力不足的问题。SFPN-SD模型很好地继承了SD模型的全部特征,同时又将随机Petri网的全部特征融入到SFPN-SD模型中。与SD模型相比,SFPN-SD模型具有系统的状态及其类型的含义更明确、状态演变过程更明确的特点,且其描述的系统变化动态性是通过事件激发的,从而更逼真地描述了复杂系统的自主动态随机演变行为。实例研究表明,SFPN-SD模型比SD模型具有更强、更全面的对复杂系统的描述关联分析与模拟能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号