首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS)。该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类。同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果。实验结果表明该文提出的算法是有效可行的。  相似文献   

2.
传统支持向量机在处理包含大量未知类别样本的训练集时性能较差。针对这一不足,在少量已知类别样本和大量未知类别样本构成的训练集上,提出一种基于蚁群聚类算法的支持向量机半监督式学习方法。该方法应用蚁群聚类算法进行聚类分析,实现了同类样本的自组织聚类;通过一个递归的类别判定算法,回收样本类别;同时,提取各类簇之间靠得相对较近的边界样本组成精简训练集,以缩减训练集规模加快学习速度。实验表明,该算法能够自适应样本类别分布,有较高的分类精度和泛化能力。  相似文献   

3.
数据挖掘中Fuzzy c—means的自适应聚类算法   总被引:2,自引:0,他引:2  
聚类算法是数据挖掘算法中的重要解决方法。针对现有聚类算法模糊c均值算法FCM中的不足,如需要预先确定聚类参数c,随机性较强、局部最优等弱点,对其算法结构加以改进,提出模糊c均值自适应算法(FCMA),增加聚类有效性问题的分析,在聚类过程中可动态调整聚类数目,这种方法可以避免在确定参数时的随机性和经验性,提高聚类算法的可靠程度。  相似文献   

4.
传统粒子群算法的优点较为明显,但是随着环境复杂度的增高,传统算法的聚类中心敏感度升高,空聚类过多,类标号对聚类结果的影响不足等问题日趋严重.为此,提出了一种改进算法,以半监督K均值聚类为目标,以自适应K值的方式,随机地计算初始化聚类中心,并根据均值聚类算法的需要编码成粒子,同时引入软性约束概念重新构造目标函数;最后使用改进后的算法进行寻优.所提出的粒子群算法改进了自适应参数,引入了免疫扰动和混沌扰动2种扰动方式,同时应用了退火策略和动态聚类策略.实验结果表明,该算法在很大程度上解决了上述问题.  相似文献   

5.
能耗问题是无线传感器网络的关键问题之一。通过深入分析已有算法存在的诸多不足,该文提出了一种基于动态聚类的分簇算法。该算法首先分析了低能耗自适应分簇的一阶能耗模型,给出了基于最小能耗的簇首数计算公式,然后在此基础上引入动态聚类思想,以最优簇首数将传感器网络内的所有节点进行聚类,得到最优的簇首节点及其内部簇成员。仿真结果表明:算法划分的网络具有低能耗、高稳定性等特点,弥补了已有算法的不足。  相似文献   

6.
一种基于高斯混合模型的无监督粗糙聚类方法   总被引:3,自引:0,他引:3  
针对数据统计分布的随机性和复杂性,从统计聚类的角度出发,采用高斯混合模型来描述整个数据的概率密度函数,提出了一种基于高斯混合模型的粗糙聚类分析方法.该方法首先利用粗糙集理论的不可区分关系性质以及生成的逻辑规则来设定EM算法的初始近似参数,然后通过Expectation-M axim ization(EM)算法估计各分量概率密度分布的最大似然参数集,最后通过密度分布概率大小来确定类别的归属.与传统的k-m eans聚类算法的试验结果比较表明,该方法是有效的,并且具有较高的聚类精度,用规则集来描述聚类的结果具有可解释性和合理性.  相似文献   

7.
聚类是一种重要的数据分析与预处理技术.与传统的静态聚类分析方法相比,基于同步模型的聚类算法属于一种动态演化的聚类分析技术.先提出了应用到聚类中的两种指数衰减加权同步模型和一种δ近邻指数衰减加权同步模型.对前两种同步模型,提出了基于指数衰减加权同步模型的聚类算法;对后一种同步模型和已发表的扩展Kuramoto模型、Vicsek简化模型及Vicsek模型的一个线性版本,提出了基于近邻同步模型的聚类算法.然后比较分析了这些同步聚类模型的算法复杂度、性质及特点.在人工数据集和8个UCI数据集的仿真实验中,对这几种同步聚类模型在聚类精度、聚类速度等方面进行了适当的比较.最后对基于同步模型的聚类算法的发展进行了总结及展望.  相似文献   

8.
在研究了基本蚁群聚类模型、信息熵以及几个经典的聚类分析算法的基础上,针对传统K—means算法的不足,首先提出了一种基于信息素的k-means改进算法,该算法以基于信息素的转移概率为判断标准来进行聚类,减少了算法的参数个数,加快了聚类的进程.在深入研究了基于信息熵的LF改进算法的基础上,提出了一种蚁群聚类组合算法策略.  相似文献   

9.
针对传统高光谱图像主成分提取方法受数据分布状态和噪声影响大的缺点,提出基于区域特征光谱的ART(Adaptive Resonance Theory)神经网络主成分提取算法.首先通过多方向阈值空间邻域聚类提取区域特征光谱作为ART的输入模式,利用ART网络的自适应特性获取地物光谱矢量特征,并通过对光谱矢量聚类完成图像的主成分提取.对高光谱图像仿真结果表明:通过提取区域特征光谱,神经网络的数据处理量减少了约97%;算法能够较准确地提取图像主成分且提取效果明显好于K-均值算法.  相似文献   

10.
为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降序排序,选择较大值所对应的样本点作为若干聚类中心。通过计算各节点和各个聚类中心点的距离,根据设定的距离阈值来判定样本类别。为了防止距离阈值设置不合理而对聚类结果造成较大扰动,引入果蝇优化算法对距离阈值参数进行优化改进,通过果蝇群体对味道浓度的不断更新优化,获得最优适应度个体。采用经过果蝇优化算法优化后的密度峰值聚类算法完成聚类分析,获得财务数据聚类结果。实验结果表明:通过合理设置果蝇优化算法气味变化率范围等参数,对于6类行业样本的聚类准确率均超过了0.9。相比于常用财务数据分析聚类算法,经过果蝇优化算法改进的密度峰值聚类算法能够获得更高的聚类准确率和稳定性。  相似文献   

11.
Data mining is the process of data selection,ex-ploration and building models using vast data stores touncover previously unknown patterns[1].It can makethe decision-making based on the knowledge,by fore-casting the unborn development tendency and action.…  相似文献   

12.
负荷特性分类与综合是实现负荷模型实用化的关键.为建立合适的变电站负荷模型,将聚类方法引入负荷特性分析,提出一种基于ACO-PAM的综合聚类算法.该综合算法是PAM算法对蚁群的历史最优位置进行聚类分析,将此位置代替PAM的参考点,作为新的聚类中心,数据将自适应地加入到适合它的聚类中.ACO算法具有全局搜索能力强、易于与其...  相似文献   

13.
基于蚁群算法的模糊C均值聚类医学图像分割   总被引:1,自引:0,他引:1  
在医学图像分割研究中,针对模糊C均值(FCM)聚类算法聚类个数难于确定、搜索过程容易陷入局部最优的缺陷,把蚁群算法与FCM聚类算法有机结合,提出了一种基于蚁群算法的模糊C均值聚类图像分割算法. 该算法首先利用蚁群算法全局性和鲁棒性的优点,得到聚类中心和聚类个数,再将其作为模糊C均值聚类的初始聚类中心和聚类个数,弥补了传统FCM聚类算法的不足,得到了较好的分割效果. 实例分析证明了算法的有效性和实用性.  相似文献   

14.
提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,提出了一种简化的粒子的编码规则,基于相异度矩阵进行粒子群优化K均值聚类,在保证聚类效果的基础上,有效降低了计算的复杂度.在多个UCI数据集上的实验结果表明,该算法是有效的。  相似文献   

15.
一种改进的模糊C-均值聚类算法   总被引:1,自引:0,他引:1  
分析了现有FCM聚类算法存在的问题,提出了一种改进的FCM聚类算法.该算法引入了最近邻聚类算法来初始化FCM算法的聚类数和聚类中心.实例分析表明改进后的FCM算法不仅能提高聚类的准确性,而且能有效地避免陷入局部最优.  相似文献   

16.
基于自适应共振理论的结构损伤识别   总被引:1,自引:1,他引:1  
目的基于自适应共振理论,提出一种基于ART2神经网络的结构损伤识别方法,以实现结构损伤识别的自主学习.方法采用一种改进算法来解决ART2方法中对输入矢量必须是非负实数的要求,并通过主成分分析方法对网络的输入矢量进行降维处理.结果通过对健康监测基准问题模型的计算表明,所采用的改进算法使得网络的输入扩展到整个实数域,且主成分分析方法有效地降低了输入矢量的维数,减少了网络的学习训练时间,从而提高了网络的泛化和判别决策能力.结论基于ART2神经网络的结构损伤识别方法具有自组织、反馈式增量学习机能,能够在不破坏原有记忆样本的情况下,学习新的样本,可以在较强噪声环境下快速准确地识别损伤,适宜于结构损伤的在线监测.  相似文献   

17.
聚类效果往往依赖于密度和相似度的定义,并且当数据的维增加时,其复杂度也随之增加。该文基于共享型最近邻居聚类算法SNN,提出了一种改进的共享型最近邻居聚类算法RSNN,并将RSNN应用于高速公路交通数据集上,解决了SNN算法在"去噪"、孤立点和代表点的判断、聚类效果等方面的不足之处。实验结果表明,RSNN算法比SNN算法在时空数据集上具有更好的聚类效果。  相似文献   

18.
基于Fuzzy ART的K-最近邻分类改进算法   总被引:4,自引:0,他引:4  
提出了一种K-最近邻改进算法,该算法用模糊自适应共振理论(Fuzzy ART)对K-最近邻的训练样本集进行浓缩,以改善K一最近邻的计算速度.该算法首先用Fuzzy ART将训练样本集中的每一类样本进行聚类,减小了训练样本集的数据量,提高了算法的计算速度,保持了预测精度,从而使该算法适用于海量数据集的情况.实验表明,该算法适用于对复杂而数据量较大的数据库进行分类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号