首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
本文首先介绍入侵检测系统的基本结构和研究情况,然后介绍了K-means聚类算法的目标函数、算法流程;在总结K-means聚类算法存在的问题的基础上,提出了一种改进的聚类算法。该算法为基于数据挖掘的入侵检测的设计提供了相关可操作的理论依据。最后,通过模拟实验,证明了改进算法的有效性。  相似文献   

2.
周鹿扬  程文杰  徐建鹏  徐祥 《计算机科学》2016,43(Z6):454-456, 484
针对k-means算法采用单一的聚类中心描述一个类簇,一般不能有效适用于任意形状簇的缺陷,在研究k-means算法以及初始聚类中心优化算法的基础上,考虑将数据集中较大或延伸状的簇分割成若干球状簇,而后合并这些小簇。该算法首先选取一组分布于高密度区域的聚类中心,将聚类中心周围的对象划分到离其最近的聚类中心形成子簇,再根据子簇之间的连通性完成子簇合并。实验证明,该算法能有效适应任意形状簇,并保持了k-means算法简单的优点。  相似文献   

3.
聚类算法在电信行业交叉销售中的应用研究   总被引:1,自引:0,他引:1  
姜鑫  李义杰  刘明依 《计算机仿真》2009,26(9):261-263,284
随着电信行业自由化和私有化进程的加快,电信业正逐步从行业垄断转变为行业竞争,面对电信市场的日趋饱和,如何提高企业自身的竞争力,挽留住现有客户、并最大化行业价值成为电信企业急待解决的问题。采用聚类分析算法中的K-means划分方法对现有客户细分分群,结合CRM中的交叉销售营销策略建立了交叉销售模型。模型的建立为电信行业交叉销售的实施提供具有可行性的技术支持,在理论研究和工程实践都具有着重要的意义。  相似文献   

4.
空间聚类是空间数据挖掘中一个非常重要的方法.本文在分析DBSCAN算法不足的基础上,提出一种改进的空间聚类算法(AISCA).为了能够有效处理大规模空间数据库,算法采用一种新的抽样技术.另外,通过引入匹配邻域的概念,使得算法在聚类时不仅考虑空间属性也考虑非空间属性.二维空间数据测试结果表明算法是可行、有效的.  相似文献   

5.
为满足海洋监测系统中赤潮监测数据的信息挖掘需求,在深入探讨数据挖掘相关算法的基础上,提出一种新的基于分组属性加权聚类的CSFCM算法。该算法将COSA(Clustering Objects on Subsets of Attributes)算法与模糊C均值算法相结合并引入相似关系预处理,再对准则函数和聚类模型加以改进。实验结果表明,该算法适用于赤潮监测数据挖掘的实时聚类需求,准确率高,为赤潮预报提供必要的决策依据。  相似文献   

6.
一种K-means聚类算法的改进与应用   总被引:1,自引:0,他引:1  
K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离和距离均和,将两者的大小比较作为识别孤立点和噪声点的依据,从而删除孤立点,减少对数据聚类划分的影响。最后将改进后的Kmeans算法应用于入侵检测系统并进行仿真实验,结果表明,基于改进的K-means算法的入侵检测系统一定程度上降低了误报率及误检率,提高了检测的准确率。  相似文献   

7.
苏进  张佑生 《计算机工程》2005,31(22):110-112
提出一种分层聚类算法,该算法可识别任意形状、大小的类,在某电信企业的客户分析中取得了较好的结果。算法首先从不同的角度对电信客户进行聚类或分类,然后以这些类为基础,实行自底向上的层次聚类得到最终的聚类结果。算法执行效率高,适合大规模数据的聚类问题。  相似文献   

8.
一种能发现自然聚类的聚类算法 *   总被引:1,自引:0,他引:1  
目前的聚类算法如K-means、DBSCAN等,采用全局参数而难以发现数据的自然聚类,提出一种新的分 级聚类算法CluFNC,能够在数据空间中发现内部聚类特征。该算法的参数包括网格大小、噪声阈值和神经节点 数量。算法首先根据参数对数据空间划分网格,接着使用高斯影响函数计算每个单元的场强,然后针对网格位 置和网格的场强使用SOM进行聚类,最后使用Chameleon算法对SOM聚类得到的神经网络节点的权值进行聚 类,并把聚类结果映射回原始数据空间以得到最终聚类结果。理论分析和实验结果证明,该算法能够发  相似文献   

9.
聚类算法的好坏直接影响聚类的效果。文章讨论了经典的k-中心聚类算珐,说明了它存在不能很好地处理大数据集的问题,提出了一种基于加权改进的k-中心聚类算法,克服了k-中心聚类算法的一些缺点,并从理论上分析了该算祛的复杂度。实验证明,用该方法实现的数据聚类与传统的基于中心的方法相比较,能有效提高数据聚类效果。  相似文献   

10.
一种大规模的递增聚类算法及其在文档聚类中的应用   总被引:2,自引:0,他引:2  
聚类是将数据进行划分,并从中发现有用信息的一种有效手段,它在很多领域都有着非常重要的应用。K均值方法是聚类方法中较常用的一种,但对于大规模的数据,而且有计算资源和时间约束的情况下,K均值方法已不能满足要求。该文提出的CFK-means方法是一种适合于大规模数据的、快速高效的递增聚类方法,它采用了聚类特性(Clus-teringFeatures,CF)结构来表示聚类,能更有效地保留和利用聚类信息。它只需扫描数据一次即可得到聚类划分,所需的计算时间和文件交换时间数倍少于K均值方法,而且聚类的准确度和K均值方法相当。通过对仿真数据和实际文本集数据进行的对比实验证明了CFK-means方法的有效性。  相似文献   

11.
孙胜 《现代计算机》2006,(7):16-18,26
介绍了Oracle数据挖掘的基本概念与组成部分,探讨了利用ODM工具进行分类的方法和基本过程,对ODM中用到的各种分类算法做出详细的分析与比较.  相似文献   

12.
随着市场竞争的日益激烈,促销技术对于网络商城提升销售额至关重要。在对网络商城的访问日志和客户交易的历史数据分析基础上,采用K-均值聚类算法设计实现基于用户兴趣、基于用户消费偏好、基于用户价值的三种类型的促销策略,为企业提供可行的个性化促销决策支持模型。  相似文献   

13.
一种用于数据挖掘的二进制挖掘算法   总被引:3,自引:0,他引:3  
提出了一种用于数据挖掘的二进制挖掘算法,适用于大型数据仓库的挖掘与分析,其基本原理是运用二进制逻辑“与”运算,从其多属性值域中抽取关键信息,形成决策规则。此方法原理简单、挖掘效率高、适应性强,对电力系统的数据挖掘具有重要的作用。  相似文献   

14.
本文分析了用于客户流失预测建模的主流技术及其优缺点。探讨了客户流失预测模型的研究方向.最后提出了云模型在客户流失预测中的应用。  相似文献   

15.
数据挖掘技术在农产品分析上的应用   总被引:2,自引:0,他引:2  
本文主要介绍了上海蔬菜市场信息分析系统的系统结构和关键技术.该系统基于B/S结构,主要运用数据挖掘技术建造多种预言模型,并采用数据仓库建模,批量数据导入,构件等关键技术。  相似文献   

16.
随着数据库技术的不断发展及数据库管理系统的广泛应用,大型数据库系统己经在各行各业普及,数据库中存储的数据量急剧增大,数据挖掘便是从海量数据库中挖掘有效或重要信息的过程。关联规则挖掘是数据挖掘领域一个非常重要的研究课题,被广泛地应用于商业界、医疗保险、金融业、电信部门等。随着时间的推移,挖掘数据库的规模会发生不断变化,人们对数据的需求也会有所不同,因此如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。  相似文献   

17.
新一代数据挖掘语言分析及应用   总被引:5,自引:0,他引:5  
关系查询语言的标准化为关系系统的开发奠定了基础,同样好的数据挖掘查询语言也必将有助于挖掘系统平台的标准化。由于数据挖掘覆盖了广泛的分析任务,而且每个任务又具有各自不同的需求,因而开发、设计完善的数据挖掘语言具有非常重要的意义。介绍了新一代数据挖掘语言及应用状况,标准化的数据挖掘工具将使客户从降低成本和投资、方便使用中受益,也将使数据挖掘成为企业决策系统中不可或缺的一部分。  相似文献   

18.
通常那些与数据集的一般行为或模型不一致的数据对象,可能包含某些重要的隐藏信息.在分析了基于单元网格的局部孤立因子的孤立点挖掘算法(GridLOF)的基础上,做出了相应的改进,提出了基于相邻网格密度因子的孤立点挖掘算法.  相似文献   

19.
本文分析了基于关联规则的Apriori算法及其存在的缺陷,提出了一种将聚类分析和关联规则相结合的联合数据挖掘算法。在大项集数量相等时,联合挖掘算法明显优于Apriori算法。  相似文献   

20.
本文首先介绍关联规则的基本概念,对关联规则算法进行了详细地分析和研究,就目前针对提高该算法效率的各种优化技术也进行了详细地描述与分析,并说明各改进算法在各商业领域中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号