首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于频繁子树挖掘算法中的前缀节点思想,将模式图分为图核—分支—连接向量三个部分,提出了CBE算法。对在分支上扩展得到的候选模式图,CBE算法能够在常数时间内完成规范化判定。通过实验证明CBE算法的子图挖掘效率有显著提高。  相似文献   

2.
信息过载问题使得推荐系统迅速发展并广泛应用,同时也出现不法商家将虚假消费记录定量地输入到系统数据库从而改变推荐系统的推荐结果以获利.因此,本文围绕3个问题展开,即:为了提高推荐系统对虚假评论的鉴别能力,首先需要准确标注虚假评论的类标,如何能获取大量准确标定的虚假评论信息;如何有效过滤虚假评论从而提高推荐的可靠性;如何实现一种高效可靠的推荐系统.针对虚假评论信息难以准确标定,本文提出了一种基于文本生成式对抗网络的自动点评技术,依据历史评论文本自动生成虚假评论文本,并依据情感分析确定生成文本的对应评分;为了提高推荐系统对包含虚假信息数据的推荐效果,本文提出了一种基于图过滤的快速密度聚类双层网络推荐算法.该算法首先提出了一种能快速确定节点执行度阈值的基于图的过滤器,有效过滤数据内虚假信息,并设计了一种快速密度聚类双层网络推荐算法,提高推荐效果.将所提出的推荐算法应用到Yelp数据集上展开试验,验证本文提出的推荐方法的有效性.  相似文献   

3.
在对NICE应用层组播协议研究的基础上,提出了一种新的应用层组播方案LCcast。它采取分层分簇的结构特征,从簇中选择出能力强的领导节点用Chord环组织起来。在数据传输方面,使用Chord环中定义的指向表并结合Dijkstra算法生成最小延迟的组播树,从而减少了传输延迟。同时,为了防止数据包丢失,对每一个簇选择了一个备用领导节点集合。仿真结果表明,LCcast组播方案在一定程度上减少了时间延迟,提高了平均数据传输率,降低了控制开销和领导节点的负载。  相似文献   

4.
针对模糊C-均值聚类对初始值敏感、容易陷入局部最优的缺陷,提出了一种基于萤火虫算法的模糊聚类方法。该方法结合萤火虫算法良好的全局寻优能力和模糊C-均值算法的较强的局部搜索特性,用萤火虫算法优化搜索FCM的聚类中心,利用FCM进行聚类,有效地克服了模糊C-均值聚类的不足,同时增强了萤火虫算法的局部搜索能力。实验结果表明,该算法具有很好的全局寻优能力和较快的收敛速度,能有效地收敛于全局最优解,具有较好的聚类效果。  相似文献   

5.
传统的基于EM算法的聚类方法,当模型的某个高斯分量的协方差矩阵变为奇异矩阵时,会导致聚类失败。提出在聚类过程中用最大后验估计(MAP)来代替极大似然估计(MLE);将一种改进的贝叶斯信息准则(BIC)与模型参数估计同时处理,扩大了模型选择的搜索范围。该算法有效地避免了协方差矩阵在迭代中陷入奇异,并将参数估计和模型选择同时进行。通过R软件进行仿真分析,结过表明改进的算法在减少计算量同时,提高了聚类的准确度,并具有鲁棒性。  相似文献   

6.
传统的谱聚类算法对初始化敏感,针对这个缺陷,引入Canopy算法对样本进行“粗”聚类得到初始聚类中心点,将结果作为K-Means算法的输入,提出了一种基于Canopy和谱聚类融合的聚类算法(Canopy-SC),减少了传统谱聚类算法选择初始中心点的盲目性,并将其用于人脸图像聚类。与传统的谱聚类算法相比,Canopy-SC算法能够得到较好的聚类中心和聚类结果,同时具有更高的聚类精确度。实验结果表明了该算法的有效性和可行性。  相似文献   

7.
为进一步降低无线传感器网络在周期性数据收集过程中的能量消耗,提出一种基于CFSFDP聚类算法的能量高效分簇路由算法。算法首先采用CFSFDP聚类算法对网络分簇进行集中控制,使网络各簇得到均衡分布的同时能够降低网络中的控制包开销;其次在簇头、副簇头及中继节点的选举公式中增加动态权重因子保证数据传输的可靠性;最后在选择下一跳中继节点时加入簇内能耗因子使各簇能耗能够更加均衡地下降。仿真结果显示,该算法网络生存周期较LEACH、KBECRA、CHTD-M算法均有显著提高,表明改进算法在降低和均衡网络能耗上具有优越性。  相似文献   

8.
针对无线传感器网络(WSN)的节点能量有限、生命周期短、吞吐量低等问题,提出一种基于遗传算法(GA)和模糊C均值(FCM)聚类的WSN分簇路由算法GAFCMCR,采取"集中分簇,分布簇头选举"的方式。网络初始化时基站采用由GA优化的FCM聚类算法形成网络分簇。第一轮簇头由距簇中心最近的节点担任;从第二轮开始,簇头的选举由上一轮的簇头负责,选举过程综合考虑候选节点的剩余能量、与基站的距离、与簇内其他节点的平均距离三个因子,并根据网络状态实时调整三个因子的权重。在数据传输阶段,将轮询机制引入簇内通信。仿真结果表明,相同网络环境下,与LEACH算法和基于K-Means的均匀分簇路由(KUCR)算法相比,GAFCMCR将网络生命周期延长了105%和20%。GAFCMCR成簇效果良好,具有良好的能量均衡性和更高的吞吐量。  相似文献   

9.
针对现有的 Neural-Gas 算法进行改进,提出了一种新的聚类算法。改进之处在于:一个点对一个簇的质心的影响程度取决于该点到其他更近的簇的质心的距离值,而不仅仅是点与簇质心间距离值按大小排列次序的序号。在几个数据集上的实验结果表明,该算法在熵、纯度、F1值、rand index、规范化互信息 NMI 等五个指标上优于 K-means 算法、Neural-Gas 算法等其他几种聚类算法,该算法是一种较好较快的算法。  相似文献   

10.
CLARANS算法是一种有效且广泛应用的聚类算法,适合发现任意形状的聚类结果,但CLARANS算法在搜索过程中容易陷入局部最优解,从而忽略全局最优解。为了避免CLARANS算法在搜索中心点时易受局部最优解的影响,提出一种将CLARANS算法中的邻接点作为QPSO算法的量子粒子,结点代价作为适应度函数对其进行寻优的改进CLARANS算法。将该改进算法应用于UCI数据集,结果表明该算法聚类效果好、收敛快,算法的稳定性、收敛性及寻优能力都有很大提高。  相似文献   

11.
熊丽琼  郭帆  余敏 《计算机应用》2008,28(4):896-898
提出了一种基于遗传聚类算法对入侵检测系统(IDS)报警进行聚合的方法。将报警间属性的相异程度转换到值域区间[0.0,1.0]上,两报警间的相异程度用一个相异度矩阵表示;利用遗传算法的自适应优化特性选取较优的聚类中心,根据报警间的相异度矩阵将相似的报警进行聚类;在此基础上,分别对每一类中的报警采用凝聚层次的聚合方法进行聚合。实验结果证明,该方法能够有效地减少重复报警。  相似文献   

12.
介绍了自组织特征映射(SOFM)算法及大规模应用聚类(CLARA)算法的基本思想,提出了一种首先利用SOFM算法对数据集进行粗聚类,确定簇的数目k和神经元的连接权向量,然后从数据集中找出与SOFM算法的神经元的连接权向量最相似的k个代表点作为CLARA算法的k个代表点的初始值的改进CLARA算法。实验结果表明,改进算法具有更高的聚类效率和更好的聚类质量。  相似文献   

13.
针对传统聚类算法聚类质量不够理想、自适应性不强和易陷入局部极小值等缺陷,提出一种基于改进免疫算法的数据聚类算法,该算法通过引入生物免疫系统中的精英保留策略和期望繁殖率,使适应度高的个体得到保留,浓度高的个体得到抑制,提高了算法的自适应性和精度,在后期通过利用混沌优化方法,使算法的局部搜索能力得到增强。实验结果表明,该算法比传统的聚类算法具有更好的性能。  相似文献   

14.
传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值.将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的.同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度.  相似文献   

15.
王娟 《微型机与应用》2011,30(20):71-73,76
传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means算法的局部性和对初始聚类中心的敏感性。  相似文献   

16.
针对局部空间信息的模糊C-均值算法(WFLICM)中空间影响因子容易受到噪声影响出现错误标识的问题,提出一种融合局部和非局部空间信息的模糊C-均值聚类图像分割算法(NLWFLICM),在WFLICM算法的模糊影响因子中引入非局部空间信息,根据噪声程度自适应地设置局部和非局部信息权重,并重新标记中心点的模糊影响因子。实验结果表明,NLWFLICM算法具有比WFLICM算法更强的鲁棒性和自适应性,并在一定程度上提高了WFLICM算法对含有大量噪声图像进行分割的鲁棒性,同时保留了图像的纹理。为了提高算法的聚类性能和收敛速度,结合Canopy算法能够快速对数据进行粗聚类的优点,提出基于Canopy聚类与非局部空间信息的FCM图像分割改进算法(Canopy-NLWFLICM),可以在NLWFLICM算法聚类前,对聚类中心进行预处理,从而提高收敛速度和图像分割精度。  相似文献   

17.
一种基于划分的层次聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
CURE算法是针对大规模数据聚类算法的典型代表。提出了一种新的算法K-CURE,该方法基于划分思想对CURE算法作了改进,同时给出了在聚类中剔除孤立点的时机选择方法。测试表明,改进后的算法效率明显高于原算法,且聚类效果良好。  相似文献   

18.
栾丽华  吉根林 《计算机应用》2005,25(5):1001-1003
以DBSCAN算法为基础,提出一种基于四叉树的快速聚类算法。新算法选择处于核心点的中空球形邻域中的点作为种子点来扩展类,大大减少区域查询的次数,降低I/O开销;使用快速生成的四叉树进行区域查询,在提高查询效率的同时,有效缩短构造空间索引的时间。文中对二维模拟数据和真实数据进行测试,结果表明新算法是有效的。  相似文献   

19.
数据聚类分析新方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
信息技术不断的进步,现实世界中需要处理的数据已由单一的数值型逐渐转变成由数值、文本、符号等类型构成的混合型数据。与现存大量的面向数值型数据的聚类算法相比,能有效处理混合型数据的聚类算法相对较少。为此,在格论基础上提出了一种适用于混合数据的聚类算法,该算法根据对象间格的覆盖数量来度量相似度,根据高覆盖数高相似度的原则选择聚类中心进行聚类。实验结果表明与其他传统聚类算法相比,新算法在不增加空间复杂度的情况下有效地提高了聚类的质量。  相似文献   

20.
王荣  李晋宏  宋威 《计算机工程与设计》2012,33(9):3553-3557,3568
为了得到准确有效的用户聚类,提出了一种基于关键字的用户聚类算法.该算法是在传统Rock算法的基础上进行了改进,提出了相似权重和平均邻居的概念,并且将用户关键字事务集的平均邻居数定义为用户访问模式相似性的标准.在不产生离群用户点的基础上,缩小了用户聚类的范围,将一个大的用户聚类更加精确的划分为几个小的用户聚类.利用用户之间的相似度阈值对数据进行过滤,减小了用户聚类的计算量.经过实验验证该算法有效的提高了相似用户聚类的准确性和运行效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号