首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
文本信息的合理表示对文本主题聚类及检索有重要作用.针对文本表示模型维度较高的问题,基于共现潜在语义向量空间模型(CLSVSM)研究惩罚性矩阵分解(PMD),利用PMD对向量进行稀疏约束,提取核心特征词,进而实现原始数据的重建;通过共现分析理论及PMD方法,深度挖掘特征词之间的语义信息,构建语义核函数(PMD_K).将本...  相似文献   

2.
一种特征加权的聚类算法框架   总被引:3,自引:0,他引:3  
高滢  刘大有  徐益 《计算机科学》2008,35(10):152-154
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架.该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数.欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架.基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性.  相似文献   

3.
一种基于特征加权的蚁群聚类新算法   总被引:3,自引:1,他引:2  
蚁群聚类算法作为一种群体智能的算法已经被证实可用于高维数据的聚类,能够快速有效地处理Web的海量、高维数据,但是传统的蚁群聚类算法并未考虑各维特征的贡献率,聚类的准确度有限。文中以优化聚类效果为目标,提出了一种基于特征加权的蚁群聚类新算法FWACCA,在新算法中考虑了各维特征对分类贡献的多少,合理地使用了Sigmoid概率转换函数和主客观结合的赋权法。实验结果表明此新算法可以有效减少聚类出错率,提高聚类的准确性。  相似文献   

4.
对于具有多特征的复杂数据,使用子数据集作为聚类成员的输入并使用加权投票的聚类集成方法可以权衡不同聚类成员的质量,提高聚类的准确性和稳定性。针对子数据集的选择及权重的计算方式,提出了最小相关特征的子数据集选取方法,并基于特征关系分析比较了五种聚类成员的权重计算方法。实验结果表明,使用最小相关特征法选择每个聚类成员的输入数据,相比随机抽样法可提高聚类集成的准确率。基于五种权重计算方法的聚类集成准确率都比单聚类高,且时间消耗有明显差异。  相似文献   

5.
王宏杰  师彦文 《计算机科学》2017,44(Z11):457-459, 502
为了提高传统K-Means聚类算法的聚类准确性,提出一种结合初始中心优化和特征加权的改进K-Means聚类算法。首先,根据样本特征对聚类的贡献程度获得初始特征权重,构建一种加权距离度量。其次,利用提出的初始聚类中心选择方法获得k个初始聚类中心,并结合初始特征权重进行初步聚类。然后,根据聚类精度来调整特征权重并再次执行聚类过程。重复执行上述过程直到聚类精度不再变化,获得最终的聚类结果。在UCI数据库上的实验结果表明,与现有相关K-Means聚类算法相比,该算法具有较高的聚类准确性。  相似文献   

6.
不平衡数据集类别分布严重倾斜,传统的聚类算法由于以提高整体学习性能为目标,往往偏向于聚集多数类,而忽视更有价值的稀有类.本文提出一种基于迭代的特征加权聚类算法,根据当前聚类后簇的特点以及特征重要性度量函数确定特征权值,利用所得权值进行下一轮聚类,直到权值稳定后结束迭代.在多个UCI不平衡数据集上的实验效果表明,本文算法能够较好地识别出重要特征并提高它们的权重,避免聚类算法过度偏向多数类,有效地提高了聚类性能.  相似文献   

7.
基于特征分组加权聚类的表情识别   总被引:5,自引:3,他引:5  
给出一种基于特征加权聚类的表情识别算法.首先通过特征分组加权充分考虑特征之间度量值的不均衡性,更好地描述了同类表情中不同特征作用的差异;其次利用模糊聚类思想在算法中引入表情不确定性描述,给出了基于形状特征识别表情时表情的模糊表示方法.该算法实现简单,计算复杂度低,能够实时、动态地更新训练结果,并且有良好的分类效果.  相似文献   

8.
非参数信息理论聚类( NIC)算法通过计算数据点与簇间的互信息来实现聚类,利用无参估计法计算集群平均熵,从而降低人为参与的成本,但该算法假定待分析样本的所有特征对分类具有相同的贡献,与目前已有的研究结果相悖。为此,提出一种特征加权的R-NIC算法,该算法考虑各维特征对模式分类的不同影响,使用ReliefF对特征进行加权变换,抑制冗余特征,加强有效特征,利用NIC算法在变换后的特征空间中进行聚类以提高聚类效果。在UCI数据集上的实验结果表明,该算法具有较高的聚类性能,聚类效果优于NIC算法。  相似文献   

9.
利用数据点特征权重的概率约束关系和可能分布,提出了分别建立在概率和可能加权特征方式之上的改进可能模糊聚类的两种模型。其中建立在可能约束之上的改进PCM算法扩展了原算法,具有更广泛的适用性。实验结果表明,算法能够实现不同概率权重或可能分布特征条件下的模糊聚类,扩展了改进的PCM算法,适用性更广。与PCM及其改进算法相比,聚类的效果较为明显。  相似文献   

10.
特征加权距离与软子空间学习相结合的文本聚类新方法   总被引:1,自引:0,他引:1  
王骏  王士同  邓赵红 《计算机学报》2012,35(8):1655-1665
文本数据维数高、数据分布稀疏、不同类别的特征相互重叠,这为聚类分析提出了挑战.针对文本数据的这一特点,将特征加权技术与软子空间相结合,基于模糊聚类的算法框架,提出了一种适用于高维文本数据的软子空间模糊聚类新方法.首先,基于加权范数理论,提出了新的特征加权距离计算方法.接着,将其与软子空间学习的理论框架相结合,提出了面向模糊聚类的新的目标学习准则.通过向约束条件中引入熵指数r,从而扩展了模糊指数m的取值范围,并给出了物理解释.基于Zangwill收敛定理对算法的全局收敛性给出理论证明.实验表明,文中算法可以使软子空间学习和聚类分析同时进行,其性能比现有的相关算法有了较大的提高.  相似文献   

11.
基于文本表示的特征项权值计算方法   总被引:3,自引:0,他引:3  
文本表示中特征项的权值计算方法决定了文本特征的提取,在很大程度上影响了文本聚类的准确率。通过系统总结常用的几种特征项权值计算方法,并逐一比较分析和研究,提出了一种性能较好的计算方法——,多重因子加权的特征项权值计算方法,经实验证明该计算方法确实能够有效地提高文本聚类的准确性。  相似文献   

12.
为了防范网络中存在的多种多样的安全威胁,由大量异构型安全设备所组成的统一管理平台得到了广泛的应用。然而如何有效地解决由这些安全设备集成所引发的各种冲突和故障,已成为网络管理的重点和难点。本文提出以距离度量和特征加权算法为基础,对网络中采集到的各种原始样本参数进行数据预处理,以便为故障诊断提供更加可靠、准确地输入参量。由于安全设备的故障特征具有很强的异构特性,所以首先对特征变量进行分类描述。将变量分为连续型、有序型、标称型、二分型四类23种。之后,对不同类型特征变量,提出Euclid、VDM算法、DVDM及IVDM算法来标称不同样本的距离。最后,综合运用知识规则和模糊理论对四种算法分别赋予不同的权重。通过实验及结果分析,显示加权后DVDM和IVDM 算法的故障分类准确度增长10%以上,说明该理论算法具有较高的可靠性和准确度。  相似文献   

13.
针对室内环境下无人四旋翼飞行器同步定位与地图创建时需要进行特征提取的问题,对特征提取的规则进行修改,提出一种新的特征提取方法。该算法具有传统特征提取算法的优点,特征提取速度快、精度高。利用实验室自主研发的无人四旋翼飞行器采集到的激光扫描仪原始数据,进行分割 聚类 线段拟合,得到无人四旋翼飞行器定位、导航需要的特征。实验表明,该算法可以实时、准确、有效地为无人四旋翼飞行器提供定位与地图创建需要的特征。  相似文献   

14.
该文针对中文实体消歧中的特征项部分匹配和协同消歧问题,提出基于特征加权重叠度的中文实体协同消歧方法。该方法利用实体指称上下文中多种特征的加权重叠度计算实体指称相似度,针对实体链接与消歧聚类约束,分类定义实体指称相似度计算方法,构建待消歧实体相似度矩阵,采用近邻传播聚类算法实现中文实体协同链接与消歧。基于CLP-2012评测数据的实验表明,提出的方法取得了较好的消歧效果,准确率、召回率和F值分别达到了84.01%、87.75%和85.65%。  相似文献   

15.
为了提高视频序列中目标跟踪的准确性,提出了结合低维Haar-like特征和在线加权多示例学习(OWMIL)的跟踪算法。将训练集中的图像进行剪裁,构建正负样本集。通过稀疏编码提取低维度的Haar-like特征来表示目标。通过这些正负样本的局部稀疏特征在线学习生成弱分类器集,并通过示例加权方法来促进学习过程,最终生成一个强分类器,用于测试视频中的目标跟踪。实验结果表明,该算法在旋转、光照和尺度变化等影响下取得了优异的效果。相比其他几种改进型多示例学习算法,提出的算法获得了更好的跟踪效果。  相似文献   

16.
为提升入侵检测系统的整体性能,文中提出一种新的算法。首先使用孤立点滤除算法进行数据前期处理,通过特征选取算法筛选出各分类器中最佳的特征空间,以增强各分类算法的训练模型。再进一步运用十倍交叉验证法对分类模型实施性能评估,把具有最佳捕捉率的分类模型作为预测测试样本类别时的加权分类模型,最后得出整体推论结果。仿真实验表明该算法整体分类准确率提高到96%,成本值减低为0.198 3,能够成功地改善网络异常入侵检测的分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号