首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 515 毫秒
1.
结构大间隔单类分类器   总被引:1,自引:1,他引:0  
目标数据呈簇分布、基于超平面的单类分类器要求嵌入结构信息时,必须分别考虑各簇数据对超平面的影响,为此,提出可用于簇分布的结构大间隔单类分类器(structural large margin one-class classifier,SLMOCC)。该算法通过分别约束各簇数据到超平面的马氏距离,并最大化最小马氏间隔,保证目标数据落入正半空间的同时,充分利用数据的簇结构信息,通过序列二次锥规划优化方法线性搜索到最优超平面。为捕捉数据簇结构,SLMOCC采用凝聚型层次聚类并借助拐点确定聚类数目,最后通过人工数据和UCI数据集与相关算法比较,验证了SLMOCC的有效性。  相似文献   

2.
基于图理论的概念间语义度量方法,改进了语义相似度部分影响因素,提出一种结合设计良好的领域本体来计算自然语言概念间的语义相似度的算法.对自然语言与本体的关系进行分析,并通过本体对节点密度、节点深度与节点层次顺序等影响概念语义相似度的因素进行了改进,综合考虑概念的语义距离、概念间关系、概念的属性与概念所处的层次等影响因素,利用本体对相关领域的基本术语和关系的准确定义,改进了基于本体的概念间语义相似度的算法.实验结果表明,该算法对于提高概念间相似度的计算精度明显高于其他算法.  相似文献   

3.
基于分布模型的层次聚类算法   总被引:1,自引:0,他引:1  
提出了一种新的层次聚类算法,先对数据集进行采样,以采样点为中心吸收邻域内的数据点形成子簇,再根据子簇是否相交实现层次聚类。在层次聚类过程中,重新定义了簇与簇之间的距离度量,并以此为基础建立堆结构。利用估计数据点总体分布的思想,证明该算法将逼近最优解。实验结果表明,算法的聚类效果大大优于现有的聚类算法。  相似文献   

4.
为解决k-means聚类算法中异常样本点破坏数据分布,致使簇中心发生较大偏差的问题,通过计算样本点与潜在簇中心的距离赋予样本点不同的权重,降低外点对数据分布的影响,并通过对权重向量施加0-norm范数在聚类模型中自适应移除外点. 采用交替最小化优化算法求解模型,在人工合成数据集和真实数据集上的实验表明,所提模型能有效降低外点对聚类的影响,可得到更有效的聚类效果.  相似文献   

5.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

6.
传统的k_means算法将欧式距离作为最常用的距离度量方法.针对基于欧式距离计算样本点与类间相似度的不足,用"相对距离"代替"绝对距离"可以更好地反映样本的实际分布,提出一种在领域知识未知的情况下基于加权欧式距离的k_means算法.针对公共数据库UCI里的数据实验表明改进后的算法能产生质量较高的聚类结果.  相似文献   

7.
该文面向本体关系集合的自动构建,提出一种基于百科词条的本体概念聚类方法,用于发现领域概念之间的语义关系。在给定领域本体概念集合的条件下,该方法首先获取相关的百科词条并建立每一概念的向量模型,然后根据距离判别法进行概念聚类,得到概念间的相近关系。采用该方法对3个领域中的领域概念集合进行聚类,实验结果表明,该文方法比传统聚类算法有更好的聚类结果,有助于概念间关系的自动获取和领域本体自动构建。  相似文献   

8.
一种基于近似EMD的DBSCAN改进算法   总被引:2,自引:2,他引:0  
DBSCAN(density based spatial clustering of applications with noise)算法是基于密度的经典聚类算法,但是该算法应用于高维数据时,常用距离函数不能很好地反映出数据点之间的关系, 从而可能导致聚类簇不够精确。如果能在高维空间中采用合适的距离度量,将会改善聚类结果。针对上述问题,提出利用近似EMD(earth mover’s distance,堆土机距离)作为距离测度,通过迭代搜索的方法找出所有直接密度可达对象实现聚类。实验结果表明:在高维文本数据的聚类中,和原来算法相比,改进算法的正确率提高了6%,两者在时间上相差不大;而对低维的Iris数据,改进算法通过EMD改善了实体间的相似性度量,减少了划分为噪声点的数据点个数,平均正确率提高了10%。实验结果表明了改进算法对高维数据的有效性,并可以改善聚类性能。  相似文献   

9.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷, 提出基于进化思想的聚类算法及其类簇融合算法, 该算法将K均值聚类算法嵌入进化聚类算法框架中, 通过调整距离倍参, 将数据逐渐划分, 在此过程中自动确定类簇数目, 提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法, 将相似度大的类簇进行融合, 使得k值逐渐趋向真实值. 实验表明, 该方法具有良好的实用性.  相似文献   

10.
为解决传统K-means算法初始质心的随机选取以及聚类过程中每个数据样本到聚类中心距离的重复计算问题,提出了一种高效的基于初始聚类中心优化的K-means算法,采用最小方差优化初始质心,通过存储每次迭代中所有数据点的簇标志和到最近聚类中心的距离并用于下一次迭代,避免了重复计算数据点到每个中心的距离。在UCI数据库中五个不同的数据集上进行了测试,对各个算法在聚类准则函数,运行时间以及迭代次数上进行实验结果比较,表明在不降低聚类性能的前提下,减少了迭代次数,缩短了聚类时间,证明了改进算法的有效性和高效性。  相似文献   

11.
一种聚类质量的评价方法及其应用   总被引:1,自引:0,他引:1  
提出一种聚类质量的评价方法,它依据以类内相似度和类外相似度描述的相关数据集的自然结构来计算给定聚类结果的分类质量.初步的实验和分析表明,该方法基本符合人类的分类直觉,可以单独用来对聚类结果进行评价,用作对其它评价方法的补充,也可以用来调整人工聚类标准.  相似文献   

12.
In wireless sensor networks (WSNs), appropriate topology control (TC) could efficiently balance the load among sensor nodes and extend network lifespan. Clustering is an effective topology control technique that could reduce energy consumption and provide scalability to WSNs. However, some clustering algorithms, including the traditional low energy adaptive clustering hierarchy (LEACH), don''t consider the residual energy and the communication distance. The energy consumption could dramatically increase in the case of long communication distance and high rate of control message exchange. In this paper we propose an energy-balanced clustering algorithm which considers the communication distance and the residual energy. Moreover the cluster head (CH) reselection is relevant to the current CH residual energy in order to reduce overheads. The simulation results demonstrate that the proposed algorithm prolongs the lifetime of the WSN in comparison to the LEACH and a hybrid clustering approach (HCA).  相似文献   

13.
为了解决车辆自组织网络中信息传递质量较差的问题,提出了一种基于权重的本地通信质量保证分簇算法,将分簇后的车辆节点划分为自组织层和对等层两层,自组织层节点使用车间通信方式进行通信,对等层节点利用3G、LTE等更可靠的传统通信方式进行通信。该算法对经典的权重分簇算法进行改进,以本地最优化代替全局最优化,引入保障通信质量最大可接受通信距离的概念,并提出了新的簇结构维护策略。仿真实验结果表明,与经典的权重分簇算法相比,该算法具有更高的簇结构稳定性和更高的分组投递率以及更低的开销。  相似文献   

14.
为了解决网络延迟检测点的有效放置问题,根据网络节点之间的网络延迟,使用系统聚类法对网络节点进行聚类,并使用递归去除1度异常节点算法提高聚类效果.提出动态距离和最小算法,在聚类结果的类中选取对应的类中心,检测点放置在类中心上.仿真结果表明,系统聚类法中类平均法更适合对网络节点进行聚类,递归去除1度异常节点后能表现出更好的聚类效果,通过动态距离和最小算法能找到放置检测点的最佳位置.使用系统聚类法中的类平均法、递归去除1度异常节点算法、动态距离和最小算法,能有效地解决网络检测点的放置问题.  相似文献   

15.
为了充分利用监督信息指导聚类过程,提出自适应半监督邻域聚类算法(adaptive semi-supervised neighborhood clustering algorithm, SSCAN)。引入监督矩阵与距离度量结合,构造合理的相似矩阵;充分利用监督信息,通过标签信息矩阵与流形正则项结合调整模型,改善聚类效果。在多种数据集进行试验,并与其他聚类算法作对比,结果表明,SSCAN可以充分利用监督信息,提高聚类的准确率。  相似文献   

16.
针对传统的基于决策树的支持向量机多类分类算法运算过程复杂、分类效率低的缺点,提出一种新的基于聚类思想的支持向量机分类方法.空间距离和聚类思想的引入,有效的提高了算法的分类效率.仿真试验表明,该方法在保持算法良好推广性的同时降低了算法的复杂度,从而提高了分类效率和分类速度.  相似文献   

17.
When X-ray fluorescence(XRF)technology is used to measure the sulfur concentration in coal online,the measurement accuracy is affected by the coal’s uneven surface and the particle size.In order to improve the accuracy of sulfur concentration measurement,an online measurement system,consisting of a portable X-ray fluorescence instrument and an auxiliary distance correction module,was developed in this paper.By measuring the standard coal samples of known sulfur concentration,we obtained a calibration curve that can be used to analyze the sulfur concentration.We studied the relationship between the X-ray fluorescence intensity(I)and the distance(D)from surfaces to instrument.The results showed that there was a good linear relationship between I and D when the sulfur content was certain.Based on these knowledge,the distance correction formula of X-ray fluorescence intensity was proposed.By applying the distance correction formula to experimental sulfur concentration measurement,we demonstrated that the measurement accuracy can be significantly increased.  相似文献   

18.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

19.
为了解决小靶距双缝光幕靶靶距精确测量问题,提出了一种利用螺纹测长原理及光电转换方式相结合的测距新方案.文中详细介绍了双缝光幕靶及靶距测量装置的结构以及测量靶距的方法.随后对双缝光幕靶靶距进行了测试并进行了测速精度分析.结果表明双缝光幕靶的相对测速精度达到0.1%,该测量精度满足测速要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号