首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 120 毫秒
1.
未确知均值聚类   总被引:1,自引:0,他引:1  
利用未确知系统理论分析特征对样本分类所作贡献,定义特征的分类权重,并作为启发性知识用于确定样本与各类间的加权距离及样本属于各类的隶属度,建立未确知均值聚类算法。IRIS数据检验表明,未确知均值聚类算法误判样本数少、收敛速度快、鲁棒性好,是一种实用、有效的无监督聚类算法。  相似文献   

2.
针对流量分类中样本标注瓶颈和类不均衡问题,提出一种基于K均值和k近邻的半监督流量分类算法。采用K均值聚类算法将混有少量标记样本和大量未标记样本的数据聚成若干个簇,然后采用k近邻算法利用簇中标记样本对未标记样本进行分类。在分类过程中根据簇中标记样本分布调整参与分类的最近邻居数,从而克服了类不均衡对识别小类流的不利影响。理论分析和实验结果都表明,算法在面对非均衡协议流时提高了小类流的识别率。  相似文献   

3.
基于未确知聚类的动态联盟伙伴选择研究   总被引:1,自引:0,他引:1  
就盟主企业建立动态联盟的过程、盟友的评价指标体系、优化决策的算法进行分析研究,建立盟主选择的数学模型,提出未确知C-均值聚类(UCM)。将此聚类算法应用于实践中,证明其可行性和有效性,最后在理论上与C-均值聚类、模糊C-均值聚类(FCM)作出比较,证明此方法的科学性。  相似文献   

4.
基于未确知聚类的动态联盟伙伴选择研究   总被引:1,自引:0,他引:1  
就盟主企业建立动态联盟的过程、盟友的评价指标体系、优化决策的算法进行分析研究,建立盟主选择的数学模型,提出未确知C-均值聚类(UCM)。将此聚类算法应用于实践中,证明其可行性和有效性,最后在理论上与C-均值聚类、模糊C-均值聚类(FCM)作出比较,证明此方法的科学性。  相似文献   

5.
针对模糊c均值聚类算法对特征噪声和样本噪声较敏感的缺陷,依据特征和样本对聚类的不同影响,将特征权值和样本权值引入到模糊c均值聚类的目标函数,并获得了一个模糊聚类模型。利用拉格朗日方法对该模型求解,提出了样本和特征权值自动调整的模糊聚类算法;同时,将核策略引入到该模糊聚类模型,提出了样本和特征权值自动调整的核模糊聚类算法。实验结果表明该方法对含有特征噪声与样本噪声数据的聚类具有较好的处理能力,为特征提取与样本选取等问题提供了一种可行的途径。  相似文献   

6.
判断聚类结果中是否存在误分类的簇,即簇中包含的样本不属于同一类。若存在,则在已有聚类结果上使用加权方案,处罚误分类的簇,输出新的聚类结果。若不存在,则输出已有聚类结果。限制簇集中存在误分类的簇,消除初始聚类中心对K-均值算法的影响,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在坏的初始化条件下,表现出更好的鲁棒性;在含有噪音的数据集中,表现出更好的抗噪性能;聚类效果更好。  相似文献   

7.
为提高半监督分类的性能,提出一种基于SOM神经网络的半监督分类算法SSC-SOM。结合SOM的聚类特性,基于先聚类后标记的思想,充分利用有标记样本和未标记样本训练SOM分类器;将聚类的形成和有标记样本分配到各个聚类中同时进行,并根据有标记样本计算各个聚类的聚类中心;在整个未标记样本的范围内,根据聚类中心,使用K近邻算法对未标记样本进行标记,挖掘未标记样本的隐含信息。在UCI数据集中进行分类实验,其结果表明,SSC-SOM的分类率比SSOM提高2.22%,且收敛性较好。  相似文献   

8.
针对数字音频信号分类问题提出了基于二型模糊集合理论的C均值聚类算法,并在此基础上应用跳跃基因遗传算法对聚类得到的初始模糊模型进行优化,最后采用向量相似性测度准则对优化后的模糊规则集合进行简化,得到最终的模糊分类器模型。与传统的一型模糊集合相比,二型模糊集合可以掌控更多的不确定性信息。基于二型模糊集合理论的C均值聚类算法对样本分布不均匀、结构不规则的样本集的聚类效果更精确。实例仿真结果对比显示,应用二型模糊C均值聚类算法的音频信号分类器比应用一型模糊C均值聚类算法的分类器得到的分类结果更准确。  相似文献   

9.
隧道围岩分级判别的未确知均值聚类模型   总被引:1,自引:0,他引:1       下载免费PDF全文
基于未确知测度理论,建立隧道围岩分级的未确知均值聚类分析模型。针对隧道围岩分级判别中等级评价中许多不确定性影响因素,选用岩石等级、风化程度、岩体弹性纵波波速、岩体结构、地质构造影响程度、节理裂隙发育程度和地下水情况等7个指标作为隧道围岩分级的判别因子;以20组隧道围岩实测数据作为训练样本,建立各评价因子的未确知测度函数,用各分类样本平均值表示其分类中心;根据信息熵理论计算各评价因子的权重,依照置信度识别准则进行等级判定;用建立的模型对20组实测数据逐一进行回检,正确率为100%。将建立的模型对待分类的10个样本进行测试,并与实际结果进行比较。研究结果表明:该模型判别预测结果与实际结果吻合,比较客观地反映了隧道围岩分级的复杂状况;且方法科学合理,意义明确,为隧道围岩分级判别提供了一种新思路。  相似文献   

10.
为了提高网络行为聚类的准确性和有效性,提出了一种用于分析网络行为的改进K均值算法.算法首先计算K类中心的轮廓系数,以及各类数据与类中心的距离,然后自动选取优秀样本,最后求均值作为优化后的初始聚类中心重新进行聚类.在UCI数据集上的实验表明,该算法聚类时间短,提高了聚类的准确性.  相似文献   

11.
导弹攻击目标选择的Fuzzy方法   总被引:4,自引:0,他引:4  
针对空战中导弹攻击目标选择这一重要问题 ,以模糊理论为基础 ,提出了改进的 Fuzzy聚类算法和 Fuzzy模式识别算法 ,实现战略目标相对重要性的模糊评价。理论分析和实例均表明 ,所提出的 Fuzzy算法与传统的目标选择方法相比 ,不仅理论先进 ,而且应用也更为方便、有效。  相似文献   

12.
在数据聚类的过程中,由于样本数据空间分布的复杂性,相似度度量过程中的重复性以及算法的自适应性等问题,聚类算法往往无法得到正确的聚类结果.为了解决样本数据空间分布复杂的问题,提出叠加信息熵数据游走聚类算法.该算法通过在数值空间构建样本叠加信息熵场,并通过数据游走进行数据分割实现聚类.实验结果表明,该算法不仅可以获得较好的聚类效果,同时具有较高的数据自适应性.  相似文献   

13.
聚类效果往往依赖于密度和相似度的定义,并且当数据的维增加时,其复杂度也随之增加。该文基于共享型最近邻居聚类算法SNN,提出了一种改进的共享型最近邻居聚类算法RSNN,并将RSNN应用于高速公路交通数据集上,解决了SNN算法在"去噪"、孤立点和代表点的判断、聚类效果等方面的不足之处。实验结果表明,RSNN算法比SNN算法在时空数据集上具有更好的聚类效果。  相似文献   

14.
多视图子空间聚类是处理高维数据的一种聚类方法,通过分别在每个视图上构造邻接矩阵的方法解决聚类问题,但未考虑到低秩表示和稀疏约束的结合在构造邻接矩阵中的重要性. 针对此问题,提出一种联合低秩表示和稀疏约束的双层多视角子空间聚类方法,使其更全面地描述数据本身,从而实现更有效的聚类,并采用ADMM方法来解决每个视图相关的低秩表示和稀疏性约束优化问题. 在多个数据集上的实验表明,其聚类性能比现有的多视角子空间聚类算法好,低秩表示和稀疏约束的结合可以提高聚类的准确性.  相似文献   

15.
文章提出了将HCM,FCM和核方法结合在一起的,一种改进模糊核聚类算法。该算法的思想是将样本数据映射到特征空间,然后在特征空间内计算类中心、隶属度以及距离表达式,再在特征空间内进行模糊聚类,并且针对个别样本(即隶属度比较接近的样本)加入了截集因子确定样本的归属,确保聚类的效果。实验结果表明,与传统的模糊聚类算法相比,改进的模糊核聚类算法在多种数据结构条件下可以有效地进行聚类,总体性能优于HCM,FCM和FKCM。  相似文献   

16.
时间序列分类是数据挖掘中的重要主题,现有的大部分时间序列分类方法较少考虑到序列形状对分类结果的影响。该文提出了一种基于k-shape的时间序列模糊分类方法。该方法通过使用k-shape聚类算法对时间序列训练数据集各类别的成员进行聚类,获得各类别的聚类中心并形成聚类中心群,将每个类别的聚类中心群作为时间序列数据模糊分类的初始聚类中心,根据隶属度最大原则确定测试时间序列数据的类别标签。在30个时间序列公开数据集上的分类实验结果表明,该方法相较于SVM、Bayes、EAIW和TLCS这4种分类算法具有更好的分类性能,对具有扭曲和位移特征的时间序列数据分类有更好的可用性。  相似文献   

17.
针对全局K-均值算法时间复杂度大的问题,提出一种增量选择初始聚类中心的新方法。选择数据集中周围分布最密集的样本作为第一个初始聚类中心,选择最小化目标函数贡献大,并且和已有聚类中心距离远的样本作为下一个初始聚类中心。改进算法减少了增量选取初始聚类中心时的计算量,降低了时间复杂度。实验证明,改进算法与全局K-均值算法、快速全局K-均值算法相比,在不影响聚类效果的基础上,减少了聚类时间,与优化初始聚类中心的算法相比,聚类效果更优。  相似文献   

18.
为了改善电梯群控系统的性能,使电梯群节能并高效运行,针对不同的交通模式采用合理的调度算法对电梯群进行优化调度,提出一种基于粒子群(PSO)的模糊核聚类算法(KFCM)的电梯交通流模式识别方法.利用基于梯度下降的粒子群优化算法代替KFCM算法的迭代过程,可使算法具有较强的全局搜索能力和局部搜索能力,并降低了KFCM算法对初始值的敏感度.利用核方法将低维特征空间的样本映射到高维特征空间,增加对样本特征的优化,并使样本特征在高维特征空间线性可分,更加容易聚类.采用在某办公楼采集的电梯交通流数据作为测试样本,仿真结果表明,与FCM聚类算法相比,该算法具有良好的性能指标,对电梯交通流的聚类效果更准确.  相似文献   

19.
首先介绍了曲面简化问题的背景和应用前景 ,同时介绍了目前主要的三大类简化算法 ,点抽取法、点聚类法和边压缩法 ,并对这三种算法的性能作了评价 ;然后在边压缩算法的基础上提出了基于点对压缩的外观保持简化算法 ,使其具有更好的应用性、普遍性、适用性、罗好的质量和可控性。并且详细地介绍了算法思想 ,对算作了分析 ,并给出了一个应用示例。最后简述了曲面简化算法的发展趋势。  相似文献   

20.
传统的决策树算法是数据分布敏感的,面对数据分布偏斜的样本集时,常导致少数类别样本的分类精度很低。已有的可以处理偏斜样本集的决策树算法只针对两种类别样本的集合。由此提出了一种新的数据分布不敏感的决策树算法——DTID。该算法通过构造各种新的少数类别样本,调整样本集合的数据分布,提高少数类别样本的分类精度。DTID算法采用样本取模运算减少了算法的运行时间。实验结果表明,与C4.5等算法相比,DTID的分类精度明显提高,即使样本集中包含多种少数类别样本也能获得较好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号