首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 68 毫秒
1.
为了改善单一聚类算法的聚类性能,提出一种基于量子遗传算法的XML文档聚类集成解决方法。该方法首先利用KNN分类算法将XML文档划分成k个差异性的聚类成员;其次根据聚类成员的关系获得内联相似度矩阵,并通过多次分割、向下、向上、双向收缩的QR算法分解特征值对应的特征向量来实现矩阵的维数缩减;然后在映射空间上用量子遗传算法实现聚类集成,把每一个样本判别到最优的聚类类别中。这样减少了数据差异性对聚类结果的影响,提高了聚类质量。实验结果表明,在真实的数据集上,该聚类集成算法比其他聚类集成算法具有更好的效果。  相似文献   

2.
基于改进量子遗传算法的聚类算法   总被引:3,自引:0,他引:3  
传统K-均值算法的初始聚类中心从数据集中随机产生,容易陷入局部最优解.提出了一种改进量子遗传聚类方法,用量子比特构成染色体,用实数对量子比特进行编码,用量子旋转门进行染色体更新,用量子Hadamard门进行染色体变异,结合了目标函数的梯度信息,对旋转门的旋转角进行动态调整.每条基因代表一个优化解,在染色体数目相同时,可使搜索空间加倍.实验结果表明,提出的方法在稳定性和分类准确率上都有所提高.  相似文献   

3.
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。  相似文献   

4.
XML结构聚类     
郝晓丽  冯志勇 《计算机应用》2005,25(6):1398-1400
针对当前XML文档结构聚类算法的一些不足,提出采用段匹配的概念来计算两棵XML文档树中的路径相似性,并在此基础上得出两棵树整体的相似度量。在整个聚类过程中,算法还把一组相关文档与一个XML聚类代表相关联,该聚类代表就包含了一个文档集合中所有文档的最相关的特征。为了构建聚类代表,算法通过构造最佳匹配树,合并树,修剪树三步来实现。通过比较聚类代表,发现新的聚类时更新聚类代表来完成文档聚类。实验结果就充分展现了算法的有效性。  相似文献   

5.
基于量子遗传聚类算法的入侵检测   总被引:1,自引:0,他引:1       下载免费PDF全文
汪林林  朱开伟 《计算机工程》2009,35(12):134-136
针对传统入侵检测算法当面临未知攻击时所缺乏的自适应性和智能化日益突出的问题,提出一种新的无监督、自适应的检测算法——量子遗传聚类算法(CQGA)。该算法利用各实例之间的欧氏距离作为相似度量标准,通过量子遗传算法寻找聚类中心以达到在无监督的条件下对数据集自动分类的目的。实验仿真结果显示,该算法能较为准确地对测试数据集进行分类,有效地解决自适应性和智能化问题。  相似文献   

6.
为解决XML文档对动态性表示不足的问题,通过对XML文档加入时间信息进行建模,提出2种基于时间序列的XML文档频繁变化结构挖掘算法FCSBF和FCSDF,实现对动态XML文档频繁变化结构的高效挖掘。在此基础上提出一种针对动态XML文档的聚类新方法,实验结果证明,该方法能够对动态XML文档进行有效的聚类。  相似文献   

7.
传统减法聚类的性能依靠山峰函数中参数的选择,只有合适的参数才能使减法聚类产生较好的效果.因此,本文提出一种基于遗传算法的减法聚类方法.首先,提出一种改进的减法聚类算法.其次,利用遗传算法优化改进算法中的参数.最后,采用3个人工数据集和2个真实数据集进行实验,实验结果表明本文方法是一种行之有效的聚类算法.  相似文献   

8.
一种基于XML文档聚类的XML近似查询算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于XML文档聚类的XML近似查询算法。给出了基于语义的XML文档间距离的计算方法,结合该语义距离,提出了基于网格的八邻域聚类算法对XML数据库进行聚类划分,进而利用在聚类过程中得到的聚类中心对静态有序选择算法的近似查询评估阶段进行优化,使得不用对XML数据库进行完全遍历就能及时返回满足用户需要的查询结果。最后,在汽车外形智能化设计的实验中表明该算法有效地提高了静态有序选择算法的查询效率。  相似文献   

9.
余宏  万常选 《计算机工程》2010,36(1):85-86,90
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传统方法。  相似文献   

10.
硬聚类算法HCM求解的结果通常都是局部的最优解,当模糊集合间的运算采用传统定义的时候,它的聚类结果中还会存在无意义的聚类集。本文通过研究表明,在HCM聚类算法中应用遗传算法,可以在一定程度上避免硬聚类算法收敛到局部最优解。因此,本文将遗传算法应用于硬聚类算法,并设计了相应的算法。但是,考虑到本算法实现时的开销 销和效率,又对该算法进行了改进,并最终提出一种新的算法--CHCM聚类算法。测试数据表明,采用改进后的聚类算法的结果90%以上能够取得全局的最优解,远远超过了采用硬聚类算法时所取得全局最优解的次数,证明了本算法的可推广性。  相似文献   

11.
蒋勇  谭怀亮  李光文 《计算机应用》2011,31(9):2546-2550
在处理大数据集聚类问题上,谱聚算法因存在占用存储空间大、时间复杂度高的缺陷而难以推广,针对此问题,提出采用多次分割、向上向下双向收缩的QR算法求得特征值对应的特征向量来实现降维,并在此基础上构造映射空间上的样本来实现量子遗传谱聚算法的聚类。该方法通过映射为后续的量子遗传谱聚算法聚类提供低维的输入,而量子遗传算法具有快速收敛到全局最优并且对初始化不敏感的特性,从而可以获得良好的聚类结果。实验结果显示,使用该算法的聚类比谱聚算法、K-means算法、NJW算法等单一方法具有更好的收敛性、稳定性和更高的全局最优。  相似文献   

12.
基于量子遗传聚类的入侵检测方法*   总被引:1,自引:0,他引:1  
现有基于聚类的入侵检测算法,聚类过程中需要预设聚类数,且算法的性能受初始数据输入顺序的影响,为此提出了一种新的基于量子遗传聚类入侵检测方法。该方法的基本思想是先自动建立初始聚类簇,再用改进量子遗传算法对初始聚类组合优化,最后进行入侵检测。实验结果表明,该方法能够有效地检测出网络中的入侵数据。  相似文献   

13.
基于频繁结构的XML文档聚类   总被引:1,自引:1,他引:0       下载免费PDF全文
研究基于频繁结构的XML文档聚类方法,其频繁结构包括频繁路径和频繁子树。首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征,对文档进行聚类。实验结果表明FrePathMiner算法和FreTreeMiner算法找到频繁结构的数量都比传统的ASPMiner算法多,这就可以为文档聚类提供更多的结构特征,从而获得更高的聚类精度。  相似文献   

14.
基于量子遗传算法的特征选择算法   总被引:6,自引:1,他引:6  
特征选择是模式识别和机器学习等领域中重要而困难的研究课题.提出一种最优特征子集评价准则和实现特征选择的一种新量子遗传算法(NQGA).NQGA采用量子门旋转角更新新方法和增强算法寻优能力及防止早熟收敛的移民和灾变策略.定性分析了NQGA的高效性.典型复杂函数测试和雷达辐射源信号特征选择的应用表明,NQGA寻优能力强、收敛速度快和能有效防止早熟现象.采用提出的准则函数和搜索策略实现特征选择,大大降低了特征维数,获得了更高的正确识别率.  相似文献   

15.
王娟 《微型机与应用》2011,30(20):71-73,76
传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means算法的局部性和对初始聚类中心的敏感性。  相似文献   

16.
基于改进量子遗传算法的连续函数优化研究   总被引:2,自引:0,他引:2  
朱筱蓉  张兴华 《计算机工程与设计》2007,28(21):5195-5197,5301
针对一般量子遗传算法在求解连续函数优化问题时存在的困难,研究了一种改进的量子遗传算法.该算法采用一种新的量子旋转门--Hε门对种群进行更新操作,可有效避免算法陷入局部最优解,提高算法的全局寻优能力.将该算法应用于几个典型复杂函数的优化测试结果表明,改进的量子遗传算法在对连续函数进行求解时,综合性能明显优于传统遗传算法和一般量子遗传算法.  相似文献   

17.
介绍Web文档聚类的应用,针对现有文档聚类算法缺乏动态更新能力、经验参数过多以及缺乏对新词的把握等不足,提出动态调整的Web文档增量聚类(Dynamically Adjusted Incremental Web Document Clustering,DAIWDC)算法,并使用同义词词林优化结果.该算法在实验中达到了88%的正确率和75%的全面率,表明其具有较高的实用价值.  相似文献   

18.
李菲  晏海华  赫建营 《计算机工程与设计》2007,28(20):4836-4838,4844
针对目前软件测试过程中通用文档自动生成所面临的问题,介绍了一种基于XML的通用测试文档生成方法.分析了软件测试文档的基本种类及文档生成的重要性,论述了将XML技术用于通用文档生成中的优势,给出了一个基于XML的通用测试文档生成模型,并探讨了该模型的关键方案设计.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号