首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
提出了一种基于改进线性判别分析和近邻法的网络入侵聚类方法,运用改进的线性判别分析方法对网络入侵样本特征进行降维处理,使用近邻分类器对数据进行聚类。该算法降低了算法的聚类时间,还提高了算法的聚类能力。实验结果表明,相比其他模型,该算法有较高的检测率和较低的误警率。  相似文献   

2.
在深入研究核Fisher判别方法的基础上,提出一种新的模糊核Fisher判别算法应用于说话人识别。采用模糊C均值聚类方法选择样本数据的同时,得到样本的模糊隶属度矩阵和聚类中心向量,进而对核Fisher判别算法中的类间离散度矩阵和类内离散度矩阵进行改进,生成模糊核Fisher判别算法,将其应用于说话人语音识别。  相似文献   

3.
潘大胜 《计算机仿真》2010,27(8):165-167,207
在优化文本文件问题的研究中,为了提高文本聚类的准确率,得到更高质量的聚类结果,在深入研究K-means算法的基础上,提出了一种改进的K-means聚类算法,并将算法应用于文本聚类仿真系统中。该算法可以自动计算聚类结果中簇的个数,消除了孤立点对聚类结果的影响,为建立文本聚类系统提供了先决条件。在文本聚类仿真实验中,对数据集进行了多次测试,测试结果表明基于改进K-means算法的文本聚类系统具有更好的聚类特性,取得了良好的应用效果。  相似文献   

4.
混合数据聚类是聚类分析中一个重要的问题。现有的混合数据聚类算法主要是在全体样本的相似性度量的基础上进行聚类,因此对大规模数据进行聚类时,算法效率不高。基于此,设计了一种新的抽样策略,在此基础上,提出了一种基于抽样的大规模混合数据聚类集成算法。该算法对利用新的抽样策略得到的多个样本子集分别进行聚类,并将结果集成得到最终聚类结果。实验证明,与改进的K-prototypes算法相比,该算法的效率有了显著提高,同时聚类有效性指标基本相同。  相似文献   

5.
为了提高新闻话题聚类精度,论文提出一种基于Word2Vec的改进密度峰值聚类算法。首先基于Word2Vec提出一种新闻文本的向量表示方法,然后针对密度峰值聚类算法存在的问题,提出一种基于KNN改进的密度峰值聚类算法。该算法首先基于KNN计算样本的局部密度,然后通过最小二乘法线性拟合选取初始聚类中心并对剩余样本进行指派形成聚类结果。在搜狐新闻数据集上的实验结果验证了该算法的有效性。  相似文献   

6.
Michael K.Ng等人提出了新K-Modes聚类算法,它采用基于相对频率的启发式相异度度量方法,有效地提高了聚类精度,但不足的是在计算各类的属性分类值频率时假定类中样本对聚类的贡献相同。为了考虑类中样本对类中心的不同影响,提出一种粗糙K-Modes算法,通过粗糙集的上、下近似度量数据样本在类内的重要性程度,不仅可以获得比新K-Modes算法更好的聚类效果,而且可以在保证聚类效果的基础上降低白亮等人提出的基于粗糙集改进的K-Modes算法的计算复杂度。对几个UCI的数据集的测试实验结果显示出新算法的优良性能。  相似文献   

7.
一种适用于小样本问题的基于边界的特征提取算法   总被引:1,自引:0,他引:1  
黄睿  何明一  杨少军 《计算机学报》2007,30(7):1173-1178
特征提取技术是模式识别领域进行数据降维和强化判别信息的有效方法.线性判别分析是监督特征提取方法的典型代表,获得广泛应用,但受到小样本问题的制约.对此提出一种适用于小样本问题的基于边界的特征提取算法.算法利用高维数据小样本情况下线性可分概率增加以及其低维投影趋于正态分布的特点,定义了新的类别边界,不但考虑了由线性判别分析提出的类内、类间离散度,也兼顾各类别的方差差异性.通过极大化该边界获得最优投影向量,同时避免因类内离散度矩阵奇异导致的小样本问题.进一步将算法推广到多类问题.高光谱数据特征提取与分类实验表明,算法在小样本情况下对于两类和多类问题均具有良好的推广性能,优于多种线性判别分析的改进算法,并且在样本较多时也取得了满意结果.  相似文献   

8.
提出了一种用于矢量量化的改进的聚类算法,该算法在MKM(Modified K-Means)算法的框架的基础上,对初始码本的生成、失真测度的选择、非典型胞腔的处理等方面进行了改进,从而减少了原算法在能量和增益上对聚类结果的影响。并将该算法应用于波形编辑孤立字识别器,这种识别器直接对语音样本的时域波形进行训练和聚类,不需要提取语音参数,算法复杂度较低,加上提出的聚类算法失真测度简单易实现,对芯片的运算能力要求不高,非常适用于有低成本要求的语音识别器场合。通过中文元音字识别的实验证明,在相同码本尺寸下,运用改进后的聚类算法的识别器的识别率有所提高。  相似文献   

9.
基于聚类和SVDD的一类入侵检测模型   总被引:1,自引:0,他引:1  
徐晶 《控制与决策》2010,25(3):441-444
为了解决传统支持向量数据描述算法(SVDD)中样本不集中导致算法包括非己空间样本,从而形成噪声影响检测性能的问题,建立一种基于SVDD算法和聚类算法相结合的入侵检测模型.首先通过K-means算法对正常样本数据进行聚类;然后利用SVDD对聚类后的数据集合进行描述;最后利用多个判决函数对样本进行判别.实验中对核函数参数的选择进行了分析,并同其他检测算法比较,验证了该思想的正确性.  相似文献   

10.
复杂分布数据的二阶段聚类算法   总被引:4,自引:0,他引:4  
公茂果  王爽  马萌  曹宇  焦李成  马文萍 《软件学报》2011,22(11):2760-2772
提出了一种用于复杂分布数据的二阶段聚类算法(two-phase clustering,简称TPC),TPC包含两个阶段:首先将数据划分为若干个球形分布的子类,每一个子类用其聚类中心代表该类内的所有样本;然后利用可以处理复杂分布数据的流形进化聚类(manifold evolutionary clustering,简称MEC)对第1阶段得到的聚类中心进行类别划分;最后综合两次聚类结果整理得到最终聚类结果.该算法基于改进的K-均值算法和MEC算法.在进化聚类算法的基础上引入流形距离,使得算法能够胜任复杂分布的数据聚类问题.同时,算法降低了引入流形距离所带来的计算量.在分布各异的7个人工数据集和7个UCI数据集测试了二阶段聚类算法,并将其效果与遗传聚类算法、K均值算法和流形进化聚类算法做了比较.实验结果表明,无论对于简单或复杂、凸或非凸的数据,TPC都表现出良好的聚类性能,并且计算时间与MEC相比明显减少.  相似文献   

11.
刘海中  朱庆保 《计算机工程》2007,33(14):190-191
基于多类别监督学习,提出了一种局部自适应最近邻分类器。此方法使用椭球聚类学习方法估计有效尺度,用于拉长特征不明显的维,并限制特征重要的维。在修正的领域中,类条件概率按预期近似为常数,从而得到更好的分类性能。实验结果显示,对多类问题,这是一种有效且鲁棒的分类方法。  相似文献   

12.
为进一步进行纹理特征分析,从纹理的方向性入手,给出了纹理方向的数学定义式,合理选择差异函数,构造了具有物理意义的纹理方向描述特征向量,数据处理方面,运用模糊贴近度的概念,结合改进后的属性均值聚类算法,对一类具有方向性的纹理图象进行分类与分割实验,取得了较好的结果,试验表明,该方法对纹理的方向性有很好的描述能力。  相似文献   

13.
刘弈  罗念龙 《计算机应用研究》2013,30(10):3001-3006
统计数据轨迹一般具有重视变化趋势、数据噪声较大、模式分布不同等特点, 直接使用传统的聚类分析方法难有很好的效果。对此在K-means算法的基础上, 分别采用了归一化处理、平滑处理以及关键峰匹配等方法处理上述三个问题, 设计了一种解决系统使用轨迹模式分析问题的改进聚类方法。通过使用仿真数据与实际数据进行测试分析, 在仿真数据上改进算法显著降低了聚类的错误率。在实际数据上, 改进算法得出的聚类结果优于K-means算法, 由此证明了改进方法比传统K-means聚类算法在该问题上效果更好。  相似文献   

14.
传统的基于真实距离的聚类分析方法不利于地震不同断层破裂传播和愈合速度的精确计算。为提高地震预测精度,提出并建立了基于软距离计算的聚类方法。给出了基于软距离聚类过程、软距离计算方法以及具体的基于软距离计算的聚类算法。以现实的强震样本点作为聚类数据源,采用该聚类方法以及其它传统聚类方法对该样本数据进行聚类分析。分析结果表明,采用该聚类方法获得的聚类中心点更接近地壳应力场演变的客观真实性,该聚类分析方法为地震的断层带下次发生强震的精确计算提供了很好的计算依据。  相似文献   

15.
为了提高分类器集成性能,提出了一种基于聚类算法与排序修剪结合的分类器集成方法。首先将混淆矩阵作为量化基分类器间差异度的工具,通过聚类将分类器划分为若干子集;然后提出一种排序修剪算法,以距离聚类中心最近的分类器为起点,根据分类器的距离对差异度矩阵动态加权,以加权差异度作为排序标准对子集中的分类器进行按比例修剪;最后使用投票法对选出的基分类器进行集成。同时与多种集成方法在UCI数据库中的10组数据集上进行对比与分析,实验结果表明基于聚类与排序修剪的分类器选择方法有效提升了集成系统的分类能力。  相似文献   

16.
This correspondence concentrates on the detection of stable clustering results when using the nonparmetric clustering technique of Jarvis and Patrick. This technique incorporates the concept of similarity based on sharing of near neighbors. Essentially, in this clustering scheme, two parameters are involved: neighborhood depth and similarity threshold. Combining a penalty for chaining with the detection of so-called hierarchical stable solutions in the field of all possible solutions, due to the setting of the two parameters, is experimentally shown to provide a powerful method for discriminating between reliable and unreliable results.  相似文献   

17.
Document clustering using locality preserving indexing   总被引:7,自引:0,他引:7  
We propose a novel document clustering method which aims to cluster the documents into different semantic classes. The document space is generally of high dimensionality and clustering in such a high dimensional space is often infeasible due to the curse of dimensionality. By using locality preserving indexing (LPI), the documents can be projected into a lower-dimensional semantic space in which the documents related to the same semantics are close to each other. Different from previous document clustering methods based on latent semantic indexing (LSI) or nonnegative matrix factorization (NMF), our method tries to discover both the geometric and discriminating structures of the document space. Theoretical analysis of our method shows that LPI is an unsupervised approximation of the supervised linear discriminant analysis (LDA) method, which gives the intuitive motivation of our method. Extensive experimental evaluations are performed on the Reuters-21578 and TDT2 data sets.  相似文献   

18.
基于遗传算法的模糊聚类分析   总被引:9,自引:0,他引:9  
模糊C-均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感。该文提出了一种基于遗传算法的模糊聚类方法,首先用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行指导,然后利用FCM进行聚类。实验结果表明:该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好。  相似文献   

19.
Deng proposed grey clustering analysis (GCA) in 1987. Later, Jin presented a new method in 1993, called grey relational clustering (GRC) method that combined grey relational analysis with clustering. However, the GRC method cannot use a tree diagram to make appropriate classification decisions without re-computation. This study thus attempts to combine GRC and hierarchical clustering analysis. Given the existence of an excess of medical resources in the Taipei area, this study attempts to understand the degree of concentration of medical resources in this area. Specifically, this study applies a geographical information system (GIS) to present the geographical distribution of hospitals in Taipei. Additionally, a new-type of cluster analysis, known as hierarchical grey relation clustering analysis, is used to analyze the distribution of hospitals and understand how they compete with one another. The analytical results demonstrate that hierarchical grey relation clustering analysis is a suitable method of analyzing geographical position. Tree diagrams can help policymakers make appropriate classification decisions without re-computation. The study results can inform hospitals of their competitors and help them to develop appropriate responses. Additionally, the analytical results can also provide a reference to government or hospital policymakers to help them position hospitals in areas, thus achieving a better distribution of medical resources in Taipei.  相似文献   

20.
给出了一种空间向量遗传聚类分析方法,对海洋环境监测得到的多参数数据进行分析。采用空间向量遗传聚类方法对采样点的温度,盐度,pH,DO等参数进行聚类,并将聚类结果投影到环境监测参数特征空间,便可以在特征空间中直观地对监测区某一时段采样点进行多参数数据分析,获知各采样点水质状况。通过对不同时段采样点数据的聚类分析,还可以对监测区海水变化趋势进行判断。此方法不仅能挖掘出采样点数据的关联性,而且使得对多采样点多参数数据的分析变得直观、清晰,提高了对海洋环境监测数据的分析效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号