首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
张蓉  袁宏 《计算机工程》2002,28(8):88-89,110
把求解数据聚类问题转换为一个图形分割寻优问题,提出一种基于快速分解模拟退火算法的数据聚类算法。实验结果表明,快速分解模拟退火算法退火时间短、收敛速度快, 磁盘I/O开销小,把它应用于数据聚类中,可以获得较好的聚类结果。  相似文献   

3.
4.
异常检测算法分析   总被引:9,自引:1,他引:9  
介绍了异常检测的算法,如基于统计的异常检测算法,基于深度的检测算法等,并重点分析了近些年来的一些新发展,如基于距离的异常检测,基于密度的异常检测以及面向高维数据的异常检测,并优缺点。  相似文献   

5.
一种面向高维混合属性数据的异常挖掘算法   总被引:2,自引:0,他引:2  
李庆华  李新  蒋盛益 《计算机应用》2005,25(6):1353-1356
异常检测是数据挖掘领域研究的最基本的问题之一,它在欺诈甄别、气象预报、客户分类和入侵检测等方面有广泛的应用。针对网络入侵检测的需求提出了一种新的基于混合属性聚类的异常挖掘算法,并且依据异常点(outliers)是数据集中的稀有点这一本质,给出了一种新的数据相似性和异常度的定义。本文所提出算法具有线性时间复杂度,在KDDCUP99和WisconsinPrognosisBreastCancer数据集上的实验表明,算本法在提供了近似线性时间复杂度和很好的可扩展性的同时,能够较好的发现数据集中的异常点。  相似文献   

6.
针对K-Prototypes聚类算法中人为指定初始聚类中心和聚类数目导致算法准确度和稳定性低下的问题,提出了基于密度优化的K-Prototypes聚类算法,该算法根据数据对象的密度分布,自适应地优化聚类数目和初始聚类中心的设置,并通过区分每个属性对聚类结果的不同影响权重,改进相异度计算公式,提升聚类的准确度。在合成数据集和UCI数据集上实验结果表明,该算法与K-Prototypes算法、DPCM算法和Fuzzy K-Prototypes算法相比,平均准确率分别提高了8.52%、4.28%和8.33%,达到了相对较好的聚类结果。  相似文献   

7.
提出了一种基于星座聚类的调制识别新方法。该算法利用改进的OPTICS算法能准确发现数据集分布的特性,不仅克服了模糊C-均值聚类算法对初始聚类中心、样本输入次序敏感等不足,而且能够同时发现不同密度的聚类,结合聚类有效性分析实现了聚类中心目的自适应调整,同基于DBSCAN的聚类算法相比,降低了时间复杂度。将该算法用于对MPSK/MAPSK信号星座重构和识别,实验结果表明该方法是实际有效的。  相似文献   

8.
现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.  相似文献   

9.
异常点检测是数据挖掘的一个重要研究方向,基于Cell的异常点检测算法生成的Cell(单元)数与维数成指数增长.当生成的单元数增多及数据量增大时,基于Cell的算法不能有效工作.分析发现这些单元中存在很多无用的空单元.本文采用CD-Tree结构对非空单元进行索引,并采用聚簇技术,将每个单元中的数据点存放在同一个磁盘页链中.实验表明,采用CD-Tree以及聚簇技术设计的异常点检测磁盘算法的效率,以及所能处理的数据集维数较原基于Cell的磁盘算法都有显著的提高.  相似文献   

10.
K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受噪声干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K-prototypes算法的缺陷,而且具有更好的分类精度和稳定性。经实验证明,改进算法是正确和有效的,明显优于传统的K-prototypes算法。  相似文献   

11.
介绍了自组织特征映射(SOFM)算法及大规模应用聚类(CLARA)算法的基本思想,提出了一种首先利用SOFM算法对数据集进行粗聚类,确定簇的数目k和神经元的连接权向量,然后从数据集中找出与SOFM算法的神经元的连接权向量最相似的k个代表点作为CLARA算法的k个代表点的初始值的改进CLARA算法。实验结果表明,改进算法具有更高的聚类效率和更好的聚类质量。  相似文献   

12.
针对支持向量机(SVM)在超平面附近进行性别识别的不准确性,引入进行加权的K近邻(KNN)算法。提出了结合加权KNN和SVM的改进KNN-SVM算法,该算法用少量已知性别样本自动确定加权KNN与SVM的最优分类阈值,并计算待识别样本和支持向量机所确定的超平面的距离,通过距离与阈值的比较进行性别识别。基于FERET人脸库进行性别实验,实验结果表明,该算法比SVM算法和不进行加权处理的KNN-SVM算法的识别率更高。  相似文献   

13.
详细分析了瓦斯监测系统在日常运行中产生异常数据的原因,阐述了异常数据辨识原则,建立了异常数据识别模型,并根据该模型设计了异常数据分析识别软件。实际应用结果表明,该分析软件能够有效减少瓦斯监测系统误报警、误断电情况的发生,提高了监测数据的真实性和可靠性。  相似文献   

14.
改进的混合属性数据聚类算法   总被引:1,自引:0,他引:1  
k-prototypes是目前处理数值属性和分类属性混合数据主要的聚类算法,但其聚类结果对初值有明显的依赖性.对k-prototypes初值选取方法进行了分析和研究,提出一种新的改进方法.该方法有更高的稳定性和较强的伸缩性,可减少一定程度的上随机性.实际数据集仿真结果表明,改进算法是正确和有效的.  相似文献   

15.
动态时间规正(Dynamic Time Warping)是语音识别中的一种经典算法,算法简单有效,因此在实现孤立词识别系统中获得了广泛的应用。提出一种DTW的改进算法,采用两次在时间域上的规正,使计算程序简洁规范,计算量减少。经实验验证,改进DTW算法在不降低识别率的前提下,提高了识别速度,提高了系统的实用性。  相似文献   

16.
花青  许国艳  张叶 《计算机应用》2015,35(11):3112-3115
随着数据流的广泛运用,数据流中异常数据的检测问题也引起了更多的关注.现有的卡尔曼滤波算法需要的历史数据量虽然小,但只适用于单个异常点的检测,对于复杂连续的异常值检测效果较差.针对这个问题,提出一种水文传感器分级标注模型,并在此基础上提出一种基于多维影响因子的卡尔曼滤波算法,加入空间、时间、起源三个维度的影响因子,在天气和汛期等影响因素改变时,对系统模型的控制参数进行适当调整,并且对测量噪声进行更加准确的估计,提高异常检测的准确性.实验结果证明,所提算法在保证运行时间相近的前提下,检测的错误率远低于基于遗忘因子的卡尔曼(AKF)算法和基于小波的卡尔曼(WKF)算法.  相似文献   

17.
CLARANS算法是一种有效且广泛应用的聚类算法,适合发现任意形状的聚类结果,但CLARANS算法在搜索过程中容易陷入局部最优解,从而忽略全局最优解。为了避免CLARANS算法在搜索中心点时易受局部最优解的影响,提出一种将CLARANS算法中的邻接点作为QPSO算法的量子粒子,结点代价作为适应度函数对其进行寻优的改进CLARANS算法。将该改进算法应用于UCI数据集,结果表明该算法聚类效果好、收敛快,算法的稳定性、收敛性及寻优能力都有很大提高。  相似文献   

18.
阈值优化的文本密度聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对DBSCAN算法的聚类性能受全局阈值影响而降低的问题,提出一种阈值优化的文本密度聚类算法。该算法使用k-近邻距离对对象进行排序,通过分位数区分密度不同的各序列,找到与其对应的优化,根据优化阈值使用密度聚类方法对对象进行聚类。改进后的聚类算法克服了阈值选取对聚类结果影响的问题,提高了聚类精确度和时间效率。采用树形结构存储聚簇,增加了聚簇的可读性。实验结果证明了该算法的有效性。  相似文献   

19.
当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效率的一种权衡。实验分析表明,改进后的CURE算法具有更高的执行效率,且聚类效果良好。  相似文献   

20.
二维方法用于图像矩阵特征提取,虽然速度快,但影响了分类速度。针对二维线性鉴别分析(Two-Dimensional Linear Discriminant Analysis,2DLDA)的特点,研究了一种基于图像分块的改进Fisher人脸识别算法,该算法首先对人脸图像进行压缩降维处理,得到相应的特征矩阵,然后利用改进Fisher算法对特征矩阵进行类间离散度矩阵和类内离散度矩阵的计算,该算法充分考虑了类别信息,避免了传统Fisher算法造成的小样本问题,有效提高了分类速度。基于ORL(Olivetti Research Laboratory)与Yale人脸数据库的实验结果证明了该算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号