首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
随着WWW上信息的爆炸性的增长,在如此大量的数据中发现有用的信息变得困难。因此.将传统的数据挖掘与Web结合进行Web挖掘,已成为数据挖掘的一个重要和繁荣的子领域。本文在研究Web挖掘关联规则的基础上,提出了一种采用关联规则的方法解决网络拥塞问题。  相似文献   

2.
随着WWW上信息的爆炸性的增长,在如此大量的数据中发现有用的信息变得困难。因此,将传统的数据挖掘与Web结合进行Web挖掘,已成为数据挖掘的一个重要和繁荣的子领域。本文在研究Web挖掘关联规则的基础上,提出了一种采用关联规则的方法解决网络拥塞问题。  相似文献   

3.
聚类分析是从给定的数据集中搜索数据对象,进行关联规则挖掘.本文融合划分方法、基于密度方法和中心计算方法中凝聚的思想,提出一种新的基于动态数据窗口的复合聚类方法.进一步将这种算法用于地理信息系统的数据挖掘,并应用于船舶航线的优化设计.  相似文献   

4.
在所有数据挖掘任务中,关联规则挖掘是一种非常重要的挖掘任务。而频繁模式挖掘是关联规则挖掘的关键步骤。其中,基于树搜索方式的挖掘方法是频繁模式挖掘的主要方法。本文综述了该方法所使用的搜索空间树、搜索方式和剪枝技术,对开发基于树搜索方式的频繁模式挖掘算法具有重要意义。  相似文献   

5.
对于大量的高维度的交易数据,利用关联规则进行数据挖掘,用户难以进行解释和利用。主要两个原因:常规关联规则挖掘算法可产生大量关联规则;一些关联规则可部分重叠。若用户能自主选择,在关联规则挖掘中所使用的相关项集,则可解决该问题。提出一种新的视觉探索工具,结构化关联映射图,使用户能够以视觉方式找到相关项集的组。该方法使用健康检查结果数据集进行验证,并且实验结果表明具有最高2×2规则贡献的和值的结构化关联映射图有助于显著减少关联分析的复杂性,并且能够集中于搜索空间的特定区域关联规则挖掘,同时避免不相关的关联规则。  相似文献   

6.
关联规则一直都是数据挖掘的热点.近些年模糊关联规则的出现是为了解决应用传统算法挖掘数量型数据集时出现的"边界问题".本文提出先用模糊聚类的方法映射数据集,在搜索模糊频繁项集时采用升维与降维相结合的方式.  相似文献   

7.
Web数据挖掘是当前数据挖掘的热点研究领域之一.由于Web页面数据的半结构化、不规则性和动态更新等特征,使得基于Web内容的数据挖掘研究具有一定的复杂性.本文首先简介如何从Web页面中提取半结构化数据,接着提出一种增量FP-Growth挖掘方法,使传统的FP-Growth方法适应于动态数据环境的关联规则挖掘,最后以中国汽车市场为例,挖掘消费者对不同类型、不同型号、不同价格轿车的购买偏好.  相似文献   

8.
基于语义的Web挖掘   总被引:5,自引:0,他引:5  
基于语义的Web挖掘是使用从现有Web数据中抽取的语义或直接使用Web数据中已有的语义结构来帮助Web挖掘。它有效地结合了语义网和Web挖掘两个领域的研究成果,既可以通过开发新的语义结构来帮助Web挖掘,又可以利用挖掘结果促进语义网的创建。本文介绍了基于语义的Web挖掘的基本思想和研究现状,分析了语义网和Web挖掘相结合的优势,并详细论述了国际上关于利用数据挖掘技术创建语义网,利用语义挖掘Web数据和直接挖掘语义网三个方面的研究工作。  相似文献   

9.
隐私保护的数据挖掘近年来已经为数据挖掘的研究热点,Web网站的服务器日志保存了用户访问页面的信息,如果不加以保护会导致用户隐私数据的泄漏。针对这个问题,讨论了在Web数据挖掘中用户行为的隐私保护问题,进而提出一种将Web服务器日志信息转换成关系数据表的方法,并通过随机化回答方法产生干扰数据表项中信息,再以此为基础,提供给数据使用者进行频繁项集以及强关联规则的发现算法,从而得到真实保密的网上购物篮商品间的关联规则。经实验证明,提出的Web使用挖掘中的隐私保护关联规则挖掘算法隐私性较好,具有一定的适用性。  相似文献   

10.
关联规则挖掘是数据挖掘中的一个重要任务,传统关联规则挖掘方法计算复杂度高、效率较低,而智能算法在搜索过程中具有保持种群多样性、鲁棒性等优点。本文提出基于免疫克隆文化算法的关联规则挖掘模型,该模型将免疫克隆算法嵌入到文化算法的框架中,利用免疫克隆算法的全局收敛性在数据库中迅速搜索频繁项目集,进而提取用户感兴趣的关联规则;利用文化算法信念空间的知识结构指导种群的进化,增强了搜索的目的性和方向性。实验表明,该模型具有较快的运行速度,提高了所得关联规则的准确率。  相似文献   

11.
伴随车辆是公安刑侦部门对海量车辆通行信息检索的一类实战需求,目的是通过模糊条件查询得到潜在的结伴作案车辆,究其本质,可将此类查询转化为数据挖掘中关联规则挖掘问题。通过对公路车辆智能监测记录系统采集的过车数据进行分析,将伴随车辆查询转化为关联规则挖掘,利用数据挖掘技术对过车数据查询问题进行综合分析,实现高效率的伴随车辆查询算法AVD(Accompany Vehicles D iscovery)。算法分析表明,AVD不但能提供准确的伴随车辆查询结果,而且效率高、扩展性强,具有较高的可行性。  相似文献   

12.
正态云关联规则在预测中的应用   总被引:25,自引:1,他引:24  
在信息处理领域,用数据挖掘方法发现关联规则和进行预测是两大热点,首先借助正态云模型来替代对数量属性论域的划分,并提出数量属性上的正态云关联规则的概念,接着给出挖掘正态云关联规则的方法,并利用已挖掘出的正态云关联规则进行预测,由于正态云模型较好地软化了数量属性论域的划分边界,从而使得挖掘出的正态云关联规则与预测的结果更容易被人理解。  相似文献   

13.
针对现有的高维空间近似k近邻查询算法在数据降维时不考虑维度间关联关系的问题,首次提出了基于维度间关联规则进行维度分组降维的方法.该方法通过将相关联维度分成一组进行降维来减少数据信息的损失,同时针对Hash降维后产生的数据偏移问题,设置了符号位并基于符号位的特性对结果进行精炼;为提高维度间关联规则挖掘的效率,提出了一种新的基于UFP-tree的频繁项集挖掘算法.通过将数据映射成二进制编码来进行查询,有效地提高了近似k近邻查询效率,同时基于信息熵筛选编码函数,提高了编码质量;在查询结果精炼的过程,基于信息熵对候选集数据的编码位进行权重的动态设定,通过比较动态加权汉明距离和符号位碰撞次数返回最终近似k近邻结果.理论和实验研究表明,所提方法能够较好地处理高维空间中近似k近邻查询问题.  相似文献   

14.
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展   总被引:13,自引:0,他引:13  
黄名选  严小卫  张师超 《软件学报》2009,20(7):1854-1865
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n 篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高.  相似文献   

15.
用模糊方法挖掘量化关联规则   总被引:9,自引:0,他引:9  
量化关联规则挖掘的一个关键问题是对连续数量值属性的划分,论文采用模糊划分来解决这个问题,实现了数据的平滑过渡,并在此基础上给出了模糊量化关联规则的形式化定义和挖掘算法。  相似文献   

16.
针对关联数据集合呈现出的大数据特性和蕴含的语义信息,提出了首先建立关联数据集的模式级链接,再进行关联规则挖掘的方法。在同领域RDF数据集上定义RDF数据项模式并提出数据项模式的产生规则;利用RDF数据查询技术从数据项模式获得RDF数据项集合,进而再推导出特定领域内的关联规则。提出的基于关联数据RDF数据项模式的关联规则挖掘方法将关联规则挖掘扩展到同一领域内的数据集合而不再局限于单一数据集,同时给出了基于Hadoop的大规模RDF数据集上的关联规则挖掘的实现方案。实验结果验证了模式级链接对于关联规则挖掘的价值和所提方法的有效性。  相似文献   

17.
为了将完全加权关联规则挖掘技术应用于查询扩展,提出面向查询扩展的基于多种剪枝策略的完全加权词间关联规则挖掘算法,该算法能够极大地提高挖掘效率;提出了一种新的查询扩展模型和扩展词权重计算方法,使扩展词权值更加合理,在此基础上提出一种新的基于局部反馈的查询扩展算法,该算法利用完全加权关联规则挖掘算法自动从局部反馈的前列初检文档中挖掘与原查询相关的完全加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展。实验结果表明,查询扩展算法的检索性能确实得到了很好的改善和提高,与现有查询扩展算法比较,在相同的查全率水平级下其平均查准率有了明显的提高。  相似文献   

18.
针对现有查询扩展存在的缺陷,将完全加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和扩展词权重的计算方法;提出基于完全加权关联规则挖掘的局部反馈查询扩展算法。该算法能自动从初检的前列文档中挖掘与原查询相关的完全加权关联规则,从规则中提取与原查询相关的扩展词,实现查询扩展。实验结果表明,与现有查询扩展算法比较,该查询扩展算法的检索性能得到很好的改善和提高。  相似文献   

19.
关联规则在肿瘤诊断中的应用   总被引:6,自引:0,他引:6  
挖掘肿瘤诊断数据库中的关联规则,能为肿瘤诊断提供有用的信息。肿瘤诊断数据库中的属性常为数量型属性,因此如何将数量型属性离散化是挖掘关联规则的难点。竞争聚集算法综合了分层聚类与划分聚类的优点,它能够有效地体现数据的实际分布情况并得到优化的聚类个数,因此能将数量型属性离散化成若干个优化的区间。  相似文献   

20.
在关联规则的评价中 ,对评价参数的度量是参数在数据库上的平均分布 ,无法刻画参数在数据库的局部分布 ;另一方面 ,评价参数也是有限的。为解决上述问题 ,首先给出评价关联规则的五个参数及参数选取的原因分析 ;然后给出分库方案及其分库上的挖掘算法 ,通过分库挖掘算法获取各参数在分库上的参数值。对获取的参数值 ,利用扩散原理计算参数在数据库上的分布 ,通过分布实现对规则的评价和取舍 ,从而实现关联规则的自动评价和取舍 ,以及最大程度的自动知识获取 ,并具有实时查询特性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号