首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于规则置信度调整的关联文本分类   总被引:1,自引:0,他引:1  
基于关联规则的文本分类方法ARC-BC是目前已知的分类效果最好的关联规则分类算法.本文提出了利用ARC-BC分类器的封闭测试的结果对分类器进行调整规则置信度的算法RCA(Rules Confidence Adjustment),参与正确分类行为次数多于参与错误分类行为次数(即"威信"较高)的规则应该拥有更高的置信度,反之,就赋予更低的置信度.实验结果表明,经过RCA算法调整的关联文本分类器的分类效果得到显著提高.  相似文献   

2.
高置信度关联规则的挖掘   总被引:3,自引:1,他引:2       下载免费PDF全文
传统的关联规则和基于效用的关联规则,会忽略一些支持度或效用值不高、置信度(又称可信度)却非常高的规则,这些置信度很高的规则能帮助人们满足规避风险、提高成功率的期望。为挖掘这些低支持度(或效用值)、高置信度的规则,提出了HCARM算法。HCARM采用了划分的方法来处理大数据集,利用新的剪枝策略压缩搜索空间。同时,通过设定长度阈值minlen,使HCARM适合长模式挖掘。实验结果表明,该方法对高置信度长模式有效。  相似文献   

3.
为了解决传统算法中存在的频繁模式集生成的瓶颈问题,本文将启发式背景知识和归纳背景知识同时运用在频繁模式的生成过程中,提出了一种基于背景知识的关联规则挖掘算法BasedBackground。该算法不仅通过启发式背景知识,有效降低了模式的计数代价,而且通过由样本挖掘获取的归纳背景知识,有效地减少I/O代价,因此提高了挖掘的效串和质量。本文最後通过恒星光谱数据作为实验数据集,验证了该算法的有效性。  相似文献   

4.
城市公共交通服务质量评价知识规则是城市公共交通企业进行服务质量评价的重要依据,优质、合理的评价知识规则将使服务质量评价更加公正、更加客观。本文在分析城市公共交通服务质量评价指标体系的基础上,将一种改进的遗传算法用于城市公共交通服务质量评价价的知识规则挖掘,提出一种基于遗传算法的城市公共交通服务质量评价知识规则挖掘方法,阐述算法的实现途径。实例表明,该方法在进行知识规则挖掘时是完全可行的、有效的。  相似文献   

5.
电子商务网站评价知识规则是对电子商务网站的运行情况和工作质量进行评价的重要依据,优质、合理的知识规则将使评价更加公正、更加客观。在分析并建立电子商务网站评价指标体系的基础上,将一种改进的遗传算法用于电子商务网站评价的知识规则挖掘,提出了一种基于遗传算法的电子商务网站评价知识规则挖掘方法。该方法利用选择算子、助长算子、交叉算子和变异算子来产生新的知识规则,使用正确度、覆盖度和可信度来对知识规则进行评价。实例表明,这种方法在进行知识规则挖掘时是完全可行的和有效的。  相似文献   

6.
关联规则挖掘在网络教学评价中的应用   总被引:1,自引:0,他引:1  
孙利  陈萍  陈华丽 《电脑开发与应用》2007,20(1):F0002-F0002
<正>1数据挖掘的概念数据挖掘是知识发现(KDD-Knowldge Dicoveryin Dambase)的重要环节之一,指从大型数据仓库提取隐含的、未知的对决策有潜在价值的知识和规则,源于数据库系统、数据仓库、统计学、机器学习、数据可视化、信息检索和高性能检索。数据挖掘的主要算法包括:粗集方法(RoughSet)、关联规则法(AssocitionRule)、分类法(Classification)、聚类法(Clutering)、遗传算法(Genetic Algorithms)、神经网络(NeuralNetworks)。2关联规则的基本概念关联规则是指数据对象之间的相互依赖关系。DM中的关联规则法的任务就是从数据库中发现那些确信度(Confidence)和支持度(Support)都大于给定值的稳健(Robust)规则。近几年,有关从数据库中发现关联规则的研究最多。目前,已经从单一概念层次关联规则的发现发展到多个概念层次的关联规则的发现。在概念层次上的不断深入,使得发现的关联规则所提供的信息越來越具体,实际上这是个逐步深化所发现知识的过程。关联规则一般用四个参数来描述其属性。下面拟用关联规则法研究学生A科成绩与B科成绩的关联为例说明其四属性含义  相似文献   

7.
关联挖掘是一种重要的数据分析方法, 提出了一种在全置信度下的增量队列关联挖掘算法模型, 在传统的FP-Growth及PF-Tree算法的关联挖掘中使用了全置信度规则, 算法的适应性得到提升, 由此提出FP4W-Growth算法并运用到对文本数据的关联计算以及对增量式的数据进行关联性挖掘的研究中, 通过实验验证了此算法及模型的可行性与优化性, 为在庞大的文本数据中发现隐藏着的先前未知的并潜在有用的新信息和新模式, 提供了科学的决策方法.  相似文献   

8.
随着社交媒体的兴起,各种社交媒体服务应运而生,社交媒体多源化现象越来越明显。一种基于关联规则挖掘的方法可以用来分析研究社交媒体多源现象,即通过同一个用户与不同社交媒体上多源数据的行为交互,挖掘社交媒体多源数据知识关联,进而设计跨网络协同的视频推荐应用。本研究框架主要分为3个步骤:(1)基于主题建模的知识发现,对用户和视频进行主题建模,得到其在主题层上的表示;(2)基于关联规则挖掘的跨网络知识关联,以跨网络共同用户作为连接不同网络的桥梁,利用关联规则的方法挖掘不同网络间的知识关联;(3)基于跨网络知识发现的冷启动视频推荐,将用户和视频映射到同一主题空间并进行主题匹配,最终进行视频推荐。实验结果表明,通过跨网络用户协同,该跨网络知识关联方法能得到除了语义关联外更加灵活有效的跨网络关联,并在冷启动的跨网络视频推荐中取得较好的推荐效果。  相似文献   

9.
随着高校选课信息系统的运行,系统中存储了大量的数据,这些数据中包含了许多潜在的有用的信息,而这些知识的提取需要利用数据挖掘技术。本文以高校选课管理为应用背景,设计并实现了一个基于数据仓库和OLAP技术的关联规则挖掘系统,具有一定的现实意义。  相似文献   

10.
关联规则挖掘作为数据挖掘的一个重要方法,在许多数据挖掘领域得到应用。本文阐述了关联规则挖掘以及其关键算法,并针对具体的实例,描述了数据挖掘工具weka挖掘关联规则的过程。  相似文献   

11.
在生产现场的问题解决中,会产生和运用大量的经验知识,对这些知识进行有效管理具有十分重要的意义。为此,以生产现场所遇的实际问题为切入点,提出面向生产现场的问题驱动知识管理方法,并结合问题解决研究中的认知机理和概念模型,构建问题驱动的知识管理方法框架及系统结构。该方法在生产现场实际问题解决中持续地学习和运用知识,从而实现知识的有效管理。最后,针对某轿车厂生产现场中存在的实际问题开发知识管理原型系统,验证所提出方法框架和系统结构的科学性和有效性。  相似文献   

12.
基于信息表和差集的关联规则挖掘   总被引:1,自引:0,他引:1  
针对挖掘稠密的长模式关联规则时,需要大量的存储空间、求长集合的交集时需要大量的计算时间以及计算候选频繁项集的支持度时需要访问反复扫描数据库,提出了基于信息表和差集的挖掘算法.实验证明,在相同的数据库和支持度情况下,该算法较apriorTID算法能减少挖掘时间和占用的空间.  相似文献   

13.
序列规则挖掘旨在发现频繁序列之间的因果关联,当前最优的序列规则产生方法仅考虑两规则间的包含关系而没有考虑多规则间的演绎关系,故而存在大量冗余。引入演绎无冗余规则的概念,分析演绎冗余的原因,重新定义了无冗余规则的概念。在频繁闭序列及其生成子的基础上,基于最大重叠项冗余性检查给出了无冗余规则抽取算法。理论分析和实验评估表明该算法在处理效率基本不变的前提下,提高了序列规则的生成质量。  相似文献   

14.
15.
崔华丽  黄光球 《信息与控制》2003,32(Z1):649-651
为了从大量数据中获取知识,本文提出了一种改进的属性约简算法,并将该算法与神经网络相结合应用于市场营销系统中.首先建立决策表,用辨识矩阵计算核,再用改进约简算法去除大量的冗余属性信息,最后采用BP神经网络来训练约简表并得出规则.实验结果表明,该方法是有效的.  相似文献   

16.
在图书馆管理系统的查询功能中,模糊查询可以使得整个系统的查询、管理变得更简洁和高效。通过区位码实现汉字拼音模糊查询,主要介绍其基本思想、算法实现示例以及使用的实例,来展示拼音模糊查询的实现方法,解决汉字模糊查询的弊端。  相似文献   

17.
为了达成好的文本分类和文本挖掘效果,往往需要使用大量的标识数据。然而数据标识不但操作复杂,而且成本昂贵。为此,在基于支持向量机的分类技术框架下,在文本分类和文本挖掘中引入未标识数据,具体的执行通过基于背景知识和基于主动学习两种方法展开。实验结果表明,基于背景知识的文本挖掘方法在基线分类器性能较强的情况下可以发挥优秀的文本挖掘性能,而基于主动学习的文本挖掘方法在一般的情况下就可以改善文本挖掘的性能指标。  相似文献   

18.
基于误差反馈对BP神经网络的影响,设计了一种反向传播的自适应误差反馈函数来增加BP网络权值的调整力度,避免网络过早进入饱和区域.将改进后的BP算法引入纱线质量预测模型中,并通过实例验证了改进后的BP神经网络算法预测结果精度较高.  相似文献   

19.
将完全加权关联规则挖掘技术应用于信息检索,提出一种基于完全加权关联规则挖掘和查询扩展的信息检索模型,重点阐述模型的设计思想及其算法和实现的关键技术.实验结果表明,该模型有效,能提高信息检索性能,有很高的实际应用价值和推广前景.  相似文献   

20.
基于规则信息量的规则提取及规则约简   总被引:1,自引:0,他引:1  
在提出规则信息量的基础上,分析了可能性规则的定义,并利用规则信息量对条件属性类和决策属性类间的概率因果关系进行了描述,重新定义了可能性规则.同时,进一步提出了能充分利用决策表信息系统中统计信息的规则提取算法LRE.本文还基于规则信息量得到了一种新的规则约简算法,这种算法是在对原有的粗集规则约简定义进行合理推广的基础上建立起来的,能很好地抵抗数据中的噪声.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号