期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何振峰熊范纶《软件学报》2005,16(5)

将数据对象间的关联限制与K-means算法结合可以取得较好的效果,但由于划分是由K个中心决定的,每一类仅由一个中心决定,分隔的表示方法限制了算法效果的进一步提高.基于数据对象间的两类限制,定义了数据对象和集合间的两类关联,以及集合间的3类关联,在此基础上给出了结合限制的分隔模型.在模型中,基于集合间的正关联,多个子集中心可以用来表示同一类,使划分的表示可以更为灵活、精细.基于此模型,给出了相应的算法CKS(constrainedK-meanswith subsets)来生成结合限制的分隔.对3个UCI数据集的实验结果显示:在准确率及健壮性上,CKS显著优于另一个结合关联限制的K-means类算法COP-K-means,与另一个代表性的算法CCL相比,也有相当优势;在时间代价上,CKS也有一定优势. 相似文献

2.

一种两阶段的限制层次聚类算法

下载免费PDF全文

何振峰《计算机工程与科学》2006,28(7):70-72

基于数据对象间的关联限制定义了类间关联系数,本文提出了两阶段的限制层次聚类算法TCCL.算法分为两个阶段,第一阶段主要依据数据对象的自然分布,基于数据对象间的距离把它们合并入一个个小类;在第二阶段,依据背景知识,基于类间关联系数来实现小类的进一步合并.一些实际数据集的实验结果表明,TCCL可以比较有效地利用所给关联限制来改善聚类效果. 相似文献

3.

面向限制K-means算法的迭代学习分配次序策略

邱烨何振峰《计算机科学》2012,39(8):196-198,209

结合关联限制K-means算法能有效地提高聚类结果,但对数据对象分配次序却非常敏感。为获得一个好的分配次序,提出了一种基于分配次序聚类不稳定性的迭代学习算法。根据Cop-Kmeans算法的稳定性特点,采用迭代思想,逐步确定数据对象的稳定性,进而确定分配次序。实验结果表明,基于分配次序聚类不稳定性迭代学习算法有效地提高了Cop-Kmeans算法的准确率。相似文献

4.

一种半监督K均值多关系数据聚类算法 总被引：1，自引：0，他引：1

高滢刘大有齐红刘赫《软件学报》2008,19(11):2814-2821

提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性. 相似文献

5.

一种基于限制的PAM算法 总被引：2，自引：1，他引：2

何振峰《计算机工程与应用》2006,42(6):190-192

利用数据对象间的关联限制可以改善聚类算法的效果,但对于关联限制与K中心点算法的结合策略则少有研究。由此研究了关联限制与PAM算法的结合方法,提出了算法CPAM。首先基于限制找到一个合适的初始分隔;在接下来反复地调整中心点的过程中,也考虑到了所给限制。实验结果显示:CPAM可以有效地利用关联限制来提高一些实际数据集的准确率。相似文献

6.

基于图收缩的半监督聚类算法

兰远东邓辉舫陈涛《计算机科学》2012,39(4):236-239

为了在只有少量已知标记的数据集中获得较好的聚类效果,提出了一种基于图收缩的半监督聚类算法。首先将整个样本空间中的数据表达为一个带权图,再根据给出的must-link约束,对图进行边收缩的修改,进而增强must-link约束。在此基础上引入图拉普拉斯算子,结合cannot-link约束将样本空间投影到一个特征子空间。最后在子空间上进行聚类分析。实验结果表明,该方法不仅提高了对复杂数据的聚类结果,而且在约束对数量较少时也能获得较好的结果。相似文献

7.

一种基于K-Means局部最优性的高效聚类算法

雷小锋谢昆青林帆夏征义《软件学报》2008,19(7):1683-1692

K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感.许多研究工作都着力于降低这种敏感性.然而,K-Means的局部最优和结果敏感性却构成了K-MeanSCAN聚类算法的基础.K-MeanSCAN算法对数据集进行多次采样和K-Means预聚类以产生多组不同的聚类结果,来自不同聚类结果的子簇之间必然会存在交集.算法的核心思想是,利用这些交集构造出关于子簇的加权连通图,并根据连通性合并子簇.理论和实验证明,K-MeanScan算法可以在很大程度上提高聚类结果的质量和算法的效率. 相似文献

8.

基于基因限制信息的特征权值优化研究

程慧杰卜宪庚《计算机与数字工程》2011,39(7):17-19

针对自组织映射算法在衡量神经元与输人数据之间相似度时将所有特征视为权值相同,导致无法在基因半监督聚类中利用限制信息的某些重要特征的不足,提出了一种新的基于基因限制信息的特征权值优化算法。算法根据限制信息优化特征的权值,将那些能够有效区分限制信息的特征赋予较大的权值。为防止在特征权值的优化中引入偏置或对非限制数据划分能力减弱,算法利用非限制信息调整特征权值。实验结果表明,算法提高了基因聚类的准确率。相似文献

9.

一种结合主动学习的半监督文档聚类算法 总被引：1，自引：0，他引：1

赵卫中马慧芳李志清史忠植《软件学报》2012,23(6):1486-1499

半监督文档聚类,即利用少量具有监督信息的数据来辅助无监督文档聚类,近几年来逐渐成为机器学习和数据挖掘领域研究的热点问题.由于获取大量监督信息费时费力,因此,国内外学者考虑如何获得少量但对聚类性能提高显著的监督信息.提出一种结合主动学习的半监督文档聚类算法,通过引入成对约束信息指导DBSCAN的聚类过程来提高聚类性能,得到一种半监督文档聚类算法Cons-DBSCAN.通过对约束集中所含信息量的衡量和对DBSCAN算法本身的分析,提出了一种启发式的主动学习算法,能够选取含信息量大的成对约束集,从而能够更高效地辅助半监督文档聚类.实验结果表明,所提出的算法能够高效地进行文档聚类.通过主动学习算法获得的成对约束集,能够显著地提高聚类性能.并且,算法的性能优于两个代表性的结合主动学习的半监督聚类算法. 相似文献

10.

结合稀疏表示与约束传递的半监督谱聚类算法

下载免费PDF全文

赵晓晓周治平《智能系统学报》2018,13(5):855-863

针对半监督谱聚类不能有效处理大规模数据,没有考虑约束传递不能充分利用有限约束信息的问题,提出一种结合稀疏表示和约束传递的半监督谱聚类算法。首先,根据约束信息生成约束矩阵,将其引入到谱聚类中;然后,将约束集合中的数据作为地标点构造稀疏表示矩阵,近似获得图相似度矩阵,从而改进约束谱聚类模型;同时,根据地标点的相似度矩阵生成连通区域,在每个连通区域内动态调整近邻点,利用约束传递进一步提高聚类准确率。实验表明,所提算法和约束谱聚类相比,在算法效率方面具有明显优势,且准确率没有明显下降;和快速谱聚类方法相比,在聚类准确率上有所提升。相似文献

11.

半监督鲁棒联机聚类算法

金骏张道强《计算机研究与发展》2008,45(3):496-502

将监督信息引入到聚类算法中去,在先前提出的鲁棒联机聚类算法(ROC)的基础上,通过引入以样本类标号形式给出的监督信息,提出了一种半监督的鲁棒联机聚类算法(Semi-ROC).在算法的聚类精度和鲁棒性能上,算法Semi-ROC比ROC和AddC有着更好的性能,在人工数据集和UCI标准数据集上的实验结果表明,Semi-ROC能有效地利用少量的监督信息来提高算法的聚类性能,得到较优的结果.另外,在添加噪声的情况下,算法Semi-ROC比原始的联机聚类算法AddC和ROC都更加鲁棒. 相似文献

12.

基于共享近邻的成对约束谱聚类算法

下载免费PDF全文

王小玉丁世飞《计算机工程与应用》2019,55(2):142-147

谱聚类算法是基于谱图划分理论的一种机器学习算法，它能在任意形状的样本空间上聚类且收敛于全局最优解。但是传统的谱聚类算法很难正确发现密度相差比较大的簇，参数的选取要靠多次实验和个人经验。结合半监督聚类的思想，在给出一部分监督信息的前提下，提出了一种基于共享近邻的成对约束谱聚类算法（Pairwise Constrained Spectral Clustering Based on Shared Nearest Neighborhood，PCSC-SN）。PCSC-SN算法是用共享近邻去衡量数据对之间的相似性，用主动约束信息找到两个数据点之间的关系。在数据集UCI上做了一系列的实验，实验结果证明，与传统的聚类算法相比，PCSC-SN算法能够获得更好的聚类效果。相似文献

13.

Guided Cluster Discovery with Markov Model

C.H. Li 《Applied Intelligence》2005,22(1):37-46

Cluster discovery is an essential part of many data mining applications. While cluster discovery process is mainly unsupervised in nature, it can often be aided by a small amount of labeled data. A probabilistic model on the clustering structure is adopted and a novel unified energy equation for clustering that incorporates both labeled data and unlabeled data is introduced. This formulation is inspired by a force-field model integrating labeling constraint on labeled data and similarity information on unlabeled data for joint estimation. Experimental results show that good clusters can be identified using small amount of labeled data. 相似文献

14.

基于SSKM算法的遥感图像半监督聚类 总被引：1，自引：0，他引：1

闫利曹君《遥感信息》2010,(2):8-11

半监督聚类是近几年提出的一种新的聚类方法,具有良好的聚类性能,但是,它们绝大多数都需要有完整的先验信息,即对于所有的样本类别,都需要有至少一个标签数据。本文提出了一种基于不完整信息的遥感图像半监督聚类方法——SSKM聚类算法,算法利用部分样本类别的先验信息,辅助遥感图像聚类。实验表明,相比于传统的K均值聚类,该算法能够有效地改善遥感图像的聚类效果。相似文献

15.

基于启发知识的神经网络训练策略

张德贤申石磊向国全王光霞《计算机工程与应用》2001,37(1):44-47

基于对目前神经网络存在问题的具体分析,认为将启发性信息引入神经网络训练将是提高网络学习能力＼质量以及效率的重要途径。进而讨论了启发知识的来源与种类,将启发性知识分成诱导性约束和强制性约束两类,进而建立了引入网络训练的相应策略,给出了启发性知识引入与选择的具体原则,并建立了两种基于导数关系的启发知识模型。最后建立了神经网络的具体训练算法。具体应用结果证明了所提出策略与方法的有效性。相似文献