首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
该文提出一种改进的带虚拟领导的Flocking模型,并基于此模型开发了一种数据聚类算法。在此算法中,数据集中的数据点被考虑为可以在空间中移动的Agent,并且根据改进的模型,生成有权无向图。然后从数据集中选定一组虚拟领导,每个数据点与其中个虚拟领导建立连接。所有与这个数据点有连接的邻居,都通过一个势函数产生场,对这个数据点进行作用,此数据点将沿着所有场矢量叠加的方向移动一段距离。算法中,虚拟领导的加入有效减少了数据点,特别是邻居较少的数据点向某个中心收敛的时间。在所有数据点不断受到作用而移动的过程中,同类的数据点就会逐渐地聚集到一起,而不同类的数据点则相互远离,最后自动形成聚类。此算法的实验结果表明,数据点能合理有效地被聚类,并且算法具有较快的收敛速度,同时,与其他算法对比也验证了此算法的有效性。  相似文献   

2.
在没有先验知识的前提下,聚类是分析样本集中不同类簇的有效方式。文中提出了一种基于改进力导向模型的聚类算法。为实现样本数据预处理的类内聚集和类间分离效果,设计了基于样本点局部密度和样本间距离的吸引力计算方法、基于样本点近邻连通图中边的介数的排斥力计算方法。实验结果表明,文中算法能够使得类内样本点更加聚集、类间样本点更加分离,可以有效地提高聚类的正确率。  相似文献   

3.
为了提高传统异常检测技术对尺度异常行为的检测能力,提出了一种基于统计量的聚类模型识别方法,将数据集中的每个数据与模型识别聚类中心的欧几里得距离进行比较,从而识别是否存在数据异常。不打破传统异常检测技术处理隔离机制,保证了规模异常行为的识别,解决了传统异常检测方法假设异常数据进行隔离的局限性。为了提高聚类精度,采用熵值法校正欧氏距离对数据属性进行加权,优化了最近邻聚类算法的相似性,并进行仿真。实验结果表明,统计方法和改进的聚类方法具有更高的聚类效率和自适应性。  相似文献   

4.
提出了一种改进蚁群文本聚类算法.改进蚁群文本聚类算法利用信息素对蚂蚁随机移动进行控制,使蚂蚁朝着文本向量相对集中的区域移动,缩短蚂蚁寻找文本向量簇的时间,提高聚类效率.采用复旦大学中文文本分类语料库进行仿真实验,实验结果表明,改进蚁群文本聚类算法不仅加快了文本聚类算法的收敛速度,而且提高文本聚类结果的精度.  相似文献   

5.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。  相似文献   

6.
一种改进的基于密度的聚类算法   总被引:1,自引:0,他引:1  
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法.  相似文献   

7.
针对传统模糊C-均值聚类算法同等对待每个属性的局限性和初始聚类中心选择的随机性,提出了一种基于相关系数优化的模糊C-均值聚类算法.首先,该算法通过计算离散系数和信息熵来确定每个属性的权重,从而强化了重要属性对聚类过程的影响,削弱了冗余属性的作用,改善了聚类效果;其次,采用相关系数和密度函数来确定样本点的密度,从而突出了样本点在同一类别中的作用;再次,将归一化后的样本点密度作为每个样本的权值;最后,由相关系数及样本点密度确定初始聚类中心.实验结果表明,该算法比传统的FCM算法具有更好的聚类效果.  相似文献   

8.
虚拟演播室中的模型需要实时运动,从而对组成模型的三角形数量有一定限制.设计了一种基于均值聚类的三维模型简化算法.该算法引入了衡量组成模型的每个顶点的权重因子,利用均值聚类算法对模型的顶点分类,通过统计组成模型三角形边长来调整分类结果,从而生成不同细节层次三角形数量可控的三维模型.实验结果表明,该算法能够在保持原模型轮廓的同时有效减少组成模型的顶点和面的数量,形成不同细节层次的模型,保证虚拟演播室中模型动画的流畅.  相似文献   

9.
《信息技术》2019,(12):76-80
文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。  相似文献   

10.
基于EM(Expectation Maximization)的混合模型聚类的效果与参数的初始值存在密切的关系.提出了一种基于近似密度的EM参数初始化方法,该方法用近似密度估计聚类样本点,再根据每个聚类统计EM的混合比、均值、协方差参数的初始值.并应用于人体腹部医学图像数据的高斯混合模型聚类分析,实验结果表明该方法比Kmeans随机初始化方法有更好的聚类效果.  相似文献   

11.
The Random Trip Model: Stability, Stationary Regime, and Perfect Simulation   总被引:1,自引:0,他引:1  
We define "random trip", a generic mobility model for random, independent node motions, which contains as special cases: the random waypoint on convex or nonconvex domains, random walk on torus, billiards, city section, space graph, intercity and other models. We show that, for this model, a necessary and sufficient condition for a time-stationary regime to exist is that the mean trip duration (sampled at trip endpoints) is finite. When this holds, we show that the distribution of node mobility state converges to the time-stationary distribution, starting from the origin of an arbitrary trip. For the special case of random waypoint, we provide for the first time a proof and a sufficient and necessary condition of the existence of a stationary regime, thus closing a long standing issue. We show that random walk on torus and billiards belong to the random trip class of models, and establish that the time-limit distribution of node location for these two models is uniform, for any initial distribution, even in cases where the speed vector does not have circular symmetry. Using Palm calculus, we establish properties of the time-stationary regime, when the condition for its existence holds. We provide an algorithm to sample the simulation state from a time-stationary distribution at time 0 ("perfect simulation"), without computing geometric constants. For random waypoint on the sphere, random walk on torus and billiards, we show that, in the time-stationary regime, the node location is uniform. Our perfect sampling algorithm is implemented to use with ns-2, and is available to download from http://ica1www.epfl.ch/RandomTrip  相似文献   

12.
康世泽  马宏  黄瑞阳 《电子学报》2017,45(12):3005-3011
针对在线文本情感摘要生成问题,本文提出了一种基于Opinosis图和马尔科夫随机游走模型的情感摘要框架.首先,该框架将原始文本转化为Opinosis图,并利用其挖掘出文本中的特征词,这些特征词可以用来对原始文本的句子进行分类;其次本文在基于聚类的条件马尔科夫随机游走模型的基础上增加了情感层,改进后的模型可以判断同一聚类中各句子的情感倾向是否具有代表性并结合情感和聚类信息对句子进行排序.实验结果表明,本文提出的方法与基准算法相比在ROUGE(Recall-Oriented Understudy for Gisting Evaluation)值上具有明显提高.  相似文献   

13.
方晨  张恒巍  王娜  王晋东 《电子学报》2018,46(11):2773-2780
针对传统服务推荐算法由于数据稀疏性而导致推荐准确性不高,以及推荐结果缺乏多样性等缺陷,提出基于随机游走和多样性图排序的个性化服务推荐方法(PRWDR).在分析直接相似关系稀疏性的基础上提出带权重的随机游走模型,通过在用户网络上进行随机游走来挖掘更多的相似关系;基于所有相似用户预测服务的QoS值,并给出服务图模型构建方法,以过滤大量性能过低的候选服务;提出最优节点集合选取策略,利用贪婪算法得到兼具推荐准确性和功能多样性的服务推荐列表.在公开发布的数据集上进行实验,并与多个经典算法进行比较,验证了本算法的有效性.  相似文献   

14.
将随机游走法和层次法相结合,采用层次化随机游走法对静态P/G网(Power and Ground Networks)进行分析.针对大规模的电路,在通过多层的参数提取和建模得到静态P/G网模型后,运用层次法将P/G网分割,在子网内采用随机游走法,并且在此基础上比较5种加速算法.实验数据表明,改进的双共轭梯度(BCG)随机游走法的计算速度是普通随机游走法的6倍以及是层次法的14倍.新方法有效地节省了计算时间,有益于对P/G网的研究.  相似文献   

15.
张元  杨志卿 《红外与激光工程》2018,47(12):1226001-1226001(9)
针对传统的基于单线激光雷达的匹配方法在多障碍物环境下匹配精度低的问题,提出了一种基于图论的匹配方法。该方法从数据点集中提取出具有凹凸性质的特征点,提取对应的线段并构建属性图模型,将点集配准问题转化为属性图匹配问题。与传统的基于线段的匹配算法相比,所提方法基于图模型引入了更多的线段之间的几何关系,使算法可以适用于多障碍物环境以及动态多障碍物环境;与传统的基于点的匹配方法相比,该方法依据特征点组成的线段进行几何意义上的匹配,通过属性图模型快速找到局部观测数据与全局数据的最佳匹配,提升了运算效率,同时也避免了传统方法易陷入局部最优解的缺点。  相似文献   

16.
邓义廷  方针  彭慧  冯伟  刘宇 《压电与声光》2022,44(3):491-496
针对微机电系统(MEMS)陀螺仪易受影响且随机误差较大,导致建立模型不准确和测量精度低的问题,该文提出了一种改进的自适应卡尔曼滤波方法。首先建立ARMA模型,在传统卡尔曼算法中引入衰减系数以减小系统旧值的影响,同时引入基于系统新息突变的预测误差矩阵清除系统的突变值。使用Allan方差对原始陀螺仪数据和滤波后的陀螺仪数据进行分析对比。结果表明,实验所用陀螺仪的角度随机游走、零偏不稳定性和角速率随机游走至少小了1个数量级,标准差明显减小,这表明改进算法有效抑制了随机噪声,提高了MEMS的性能。  相似文献   

17.
针对点云配准过程中易产生错误匹配点、配准时间长、配准精度低等问题.提出了基于三维尺度不变特征变换(3 DSIFT)关键点检测方法,结合二进制方向直方图描述子(BSHOT)构建点云匹配对的配准方法.该方法首先利用差分高斯模型在三维尺度空间上检测SIFT关键点,其次在关键点的邻域构建局部坐标系来计算SHOT描述子,并将SH...  相似文献   

18.
Concerning the continually perceiving performance of virtual access points (VAP) was urgent in software-defined wireless network (SDWN),with the features of VAPs’ measurement data (VMD),a self-adaptive matrix completion algorithm based on random walk was proposed,named RW-MC.Firstly,the discrete ratio and covering ratio of VMD account for a sample determination model was used to claim initial samples.Secondly,random walk model was implemented for generating sampling data points in the next iteration.Finally,a self-adaptive sampling redress model concerning the differences between the current error rates and normalize error rates of neighboring completion matrices.The experiments show that the approach can collect the real-time sensory data,meanwhile,maintain a relatively low error rate for a small sampling rate.  相似文献   

19.
对于高维空间的近邻查找问题,位置敏感哈希(LSH)在查询代价和磁盘空间利用上有着出色表现。在传统分析模型下,LSH被视作随机算法,唯一不确定因素就是哈希函数的选择。研究中将这种模型下得到的碰撞概率称为基于哈希函数的碰撞概率。在本文中,使用了不同的分析模型对LSH作了理论分析。此工作的出发点有2个:1)在现有的分析模型下,用户为了达到理论的效果,必须对每个查询点产生随机的数据结构,这在实际应用中是不现实的。2)用户所关心的性能指标是随机查询点在一个数据结构上的期望碰撞概率。基于此,本篇论文即推导了在汉明距离下,随机点对在任意单个哈希函数上的碰撞概率。研究将此模型下推导出的碰撞概率称为基于随机查询的碰撞概率。同时也一并证明了在汉明空间中,2种碰撞概率完全相同。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号