首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对企业电力负荷随机性强、稳定性低、预测精度不理想等问题,提出了一种基于最大偏差相似性准则的BP神经网络短期电力负荷预测算法。首先对最大偏差相似性准则算法进行修改,并提出使用预测日的负荷特征向量与最大偏差相似性准则算法聚类之后的类中心负荷特征的距离来确定预测日的相似日类别;然后将聚类后的相似日类别负荷数据作为BP网络的训练数据,输出预测日起始的连续三天96整点负荷值。实验表明,该方法提出的短期电力负荷预测方法在精度和网络训练时间上都有较大的提升,具有较高的有效性和实用性。  相似文献   

2.
针对低压用户相序识别困难、成本高问题,提出了一种基于电压曲线聚类分析的低压用户相序识别方法。首先采用皮尔逊相关系数度量不同用户智能电表电压曲线之间的波动相似性;接着基于电压曲线相似性分布的密度信息选择初始聚类中心对象;然后采用K-medoids算法将智能电表电压曲线波动相似的台区用户聚类为3个不同用户组,进而识别低压台区用户相序。该方法在某电网公司进行了应用验证,在变压器三相不平衡严重台区开展用户相序识别,然后根据不同相序用户负载情况进行负荷再分配,从而降低该台区变压器三相负载不平衡度,取得了良好的效果。#$NL关键词:相序识别;三相不平衡;皮尔逊相关系数;密度信息;K-medoids算法  相似文献   

3.
提出一种密度敏感模糊核最大熵聚类算法.该算法首先通过核函数将原始非线性非高斯的数据集转化为核空间数据集,然后利用核函数的相似性抵消不属于该聚类的样本数据在聚类过程中对聚类中心求解的干扰,消除正则化系数对聚类结果的影响,进而抑制传统最大熵聚类算法的趋同性.最后通过引入相对密度项,解决因样本数据在特征空间的分布差异而导致的聚类中心求解偏差问题,从而提高聚类结果的准确性.实验部分,本文讨论了算法参数间的关系以及对聚类结果的影响.通过与传统模糊C均值聚类算法、核模糊C均值聚类算法、最大熵聚类算法、最大熵规范化权重核模糊C均值聚类算法以及其他两种改进最大熵聚类算法的聚类结果进行对比分析,结果表明本文提出的密度敏感模糊核最大熵聚类算法的聚类性能明显优于其他算法.  相似文献   

4.
综合颜色和轮廓曲线特征的图像检索方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
传统的基于内容图像检索(CBIR)及跟踪算法主要利用图像的颜色、纹理等特征进行相似性比较,但大量的实验和应用也表明利用颜色和纹理进行图像相似性比较在空间结构和对象形状上难以精确控制,致使图像检索经常出现一些不可预料的结果。为了提高图像在形状、颜色及纹理上的检索精度,提出了一种综合颜色和图像轮廓曲线特征的检索方法。该方法分割图像并提取图像中感兴趣对象的轮廓,对提取的轮廓进行仿射变换及最小值化处理,经处理后的轮廓带有边缘的完整信息,具有几何不变性;利用聚类的颜色信息,提取主聚类的直方图,所提取的直方图不仅包含了主聚类的颜色信息也包含了该聚类的空间位置信息。利用检索对象与被检索对象的颜色距离直方图及轮廓曲线距离偏差的加权平均度量检索及被检索对象的相似性。实验结果表明,针对基于感兴趣对象的图像检索问题,给出了一种具有高度检索精度的算法。  相似文献   

5.
针对轨迹聚类算法在相似性度量中多以空间特征为度量标准,缺少对时间特征的度量,提出了一种基于时空模式的轨迹数据聚类算法。该算法以划分再聚类框架为基础,首先利用曲线边缘检测方法提取轨迹特征点;然后根据轨迹特征点对轨迹进行子轨迹段划分;最后根据子轨迹段间时空相似性,采用基于密度的聚类算法进行聚类。实验结果表明,使用所提算法提取的轨迹特征点在保证特征点具有较好简约性的前提下较为准确地描述了轨迹结构,同时基于时空特征的相似性度量因同时兼顾了轨迹的空间与时间特征,得到了更好的聚类结果。  相似文献   

6.
权吸引子传播算法及其在文本聚类中的应用   总被引:1,自引:0,他引:1  
吸引子传播算法(affinity propagation, AP)是一种新的高效聚类算法.由于AP算法简单易用,它已被广泛应用到数据挖掘的各个领域.在AP算法中,相似性度量具有重要作用.另一方面,传统的文本挖掘常采用向量空间模型和满足欧氏空间的相似性度量.这种方法的优点是简单且易于实现,但随着数据规模的膨胀,向量空间将变得高维稀疏并将导致计算复杂度快速增长.为解决此问题,给出了相似特征集、排斥特征集和仲裁特征集的概念,在这些概念的基础上提出了一种能够包含文本结构信息的非欧空间相似性度量方法.并提出了一种新的聚类算法,称之为权吸引子传播算法(weight affinity propagation, WAP).为检验提出算法的聚类效果,选用标准数据集Reuters-21578进行了验证.实验结果表明WAP明显优于k-means聚类算法、具备非线性特征的SOFM聚类算法和采用经典相似性度量的吸引子传播算法等3种经典聚类算法.  相似文献   

7.
如何有效地约简频繁项集的数量是目前数据挖掘研究的热点。对频繁项集进行聚类是该问题的解决方法之一。由于生成子是全体频繁项集的无损精简表示,故对生成子进行聚类与对全体频繁项集进行聚类具有相同的效果。提出了一种基于生成子的频繁项集聚类算法。首先,利用最小描述长度原理,讨论了选择生成子进行聚类的合理性;其次,给出了生成子的剪枝策略及挖掘算法;最后,在一种新的项集相似性的度量标准的基础上,给生成子的聚类算法。实验结果表明,该方法可有效地减少项集的数量,并具有较高的挖掘效率。  相似文献   

8.
提出一种基于频繁词序列的层次文本聚类算法,该算法考虑频繁词的次序关系和频繁词序列的文本频繁的重要性,构造了一种更合理的层次关系。实验证明,基于频繁词序列的层次文本聚类算法能够提高文本聚类的精确度。  相似文献   

9.
聚类问题究其根本在于样本之间相似性的定义和聚类效果优劣的评价。粒子群聚类算法以其较好的聚类效果而受到广大研究者的关注。提出了一种新的衡量聚类效果的函数,并对其进行一定的分析。另外,从分析粒子群算法的拓扑结构出发,在高斯动态粒子群算法的基础上,提出了一种自适应种群的高斯动态粒子群聚类算法。实验表明,该衡量函数能够有效地评价聚类效果的优劣,其算法具有良好的聚类效果,在高维数据上表现优良。  相似文献   

10.
在分析现有交通状态辨识理论的局限性的基础上,提出了一种新的交通状态辨识模型。此模型针对每种交通状态样本数据都具有一定的相似性,不同状态之间的样本具有相异性的性质,采用数据挖掘方法中的聚类算法对不同状态的交通流数据进行聚类。所提出的模型避免了目前模型中只采用单个交通流参数进行状态识别的缺点,为交通状态的辨识提供了一种新的思路。  相似文献   

11.
对校园网主干数据流中IP地址进行聚类,可以得到网络用户访问地址的分布概况从而了解用户行为特征。已有聚类算法大都将IP地址作为普通数字考虑,忽略了其特征属性以致聚类结果不合理。为此提出一种改进算法:首先基于最长前缀匹配和改进的最近邻规则算法得到初始聚类,然后运用逐步优化层次聚类的思想进一步聚合最靠近子类,最终得到基于IP地址特征属性的聚类。实验结果表明该算法与以往算法相比,提高了聚类效果,具有较好的准确性和可行性。  相似文献   

12.
在包层次的代码重构研究中,为了得到“高内聚、低耦合”的软件结构,层次聚类算法因其简单有效、聚类精度高等特点被认为是一种较好的软件聚类方法。但是,层次聚类算法时间复杂度高,不利于处理较大规模的软件。而基于密度聚类的DBSCAN算法则与之相反,具有较快的聚类速度,但是精度却较低。因此,提出一种基于DBSCAN的软件层次聚类算法,利用DBSCAN算法所产生的类来约束层次聚类算法的聚类空间,该算法可以保持层次聚类算法的精度不变,且它的时间复杂度介于DBSCAN和层次聚类算法之间。实验结果表明,该算法可以有效地对软件进行合理划分,并通过专家评判、模块划分度量指标和算法运行时间对比来表明其比其他常用聚类算法的性能更好。  相似文献   

13.
交通流时间序列分离方法   总被引:3,自引:0,他引:3  
采用聚类分析方法对交通流时间序列进行分析可以发现典型的交通流变化模式。通常 可采用欧式距离及K均值算法进行时间序列聚类,但经分析发现单凭此方法还难以实现不同变化趋 势的交通流时间序列的有效分离。针对此问题,提出了将动态时间弯曲及灰色关联度引入交通流时 间序列相似性度量,且结合层次化聚类方法对交通流时间序列进一步分离的方法。通过实验研究,发 现基于灰色关联度的层次化聚类方法能较好地实现交通流时间序列的进一步有效分离。  相似文献   

14.
提出了一种新的聚类方法.针对货篮数据的特点,运用概念格获取最大频繁项目集,并以此作为初始聚类,采用适合于货篮数据的相似性测量方法,求得聚类结果.研究表明,该方法所生成的聚类比其它传统方法更优化,而且效率较高.  相似文献   

15.
谱聚类将数据聚类问题转化成图划分问题,通过寻找最优的子图,对数据点进行聚类。谱聚类的关键是构造合适的相似矩阵,将数据集的内在结构真实地描述出来。针对传统的谱聚类算法采用高斯核函数来构造相似矩阵时对尺度参数的选择很敏感,而且在聚类阶段需要随机确定初始的聚类中心,聚类性能也不稳定等问题,本文提出了基于消息传递的谱聚类算法。该算法采用密度自适应的相似性度量方法,可以更好地描述数据点之间的关系,然后利用近邻传播(Affinity propagation,AP)聚类中“消息传递”机制获得高质量的聚类中心,提高了谱聚类算法的性能。实验表明,新算法可以有效地处理多尺度数据集的聚类问题,其聚类性能非常稳定,聚类质量也优于传统的谱聚类算法和k-means算法。  相似文献   

16.
Hierarchical clustering of mixed data based on distance hierarchy   总被引:1,自引:0,他引:1  
Data clustering is an important data mining technique which partitions data according to some similarity criterion. Abundant algorithms have been proposed for clustering numerical data and some recent research tackles the problem of clustering categorical or mixed data. Unlike the subtraction scheme used for numerical attributes, there is no standard for measuring distance between categorical values. In this article, we propose a distance representation scheme, distance hierarchy, which facilitates expressing the similarity between categorical values and also unifies distance measuring of numerical and categorical values. We then apply the scheme to mixed data clustering, in particular, to integrate with a hierarchical clustering algorithm. Consequently, this integrated approach can uniformly handle numerical data and categorical data, and also enables one to take the similarity between categorical values into consideration. Experimental results show that the proposed approach produces better clustering results than conventional clustering algorithms when categorical attributes are present and their values have different degree of similarity.  相似文献   

17.
传统的频繁路径挖掘分析主要通过关联规则算法实现,但其在处理大型数据集时,会产生占用内存过多,数据处理速度慢等问题,对此提出一种基于Fuzzy [c]-means聚类算法的并行Apriori算法模型。该模型通过Fuzzy [c]-means算法完成对原始数据集的聚类分析,将同一区域的物流路径数据划分到内部相似度较高的数据类,并利用Apriori算法对各数据类中的频繁模式进行挖掘分析,进而获得各区域的物流频繁路径。同时通过Hadoop平台实现算法的并行化,有效提高算法运行效率和质量。通过对物流频繁路径的挖掘分析,使管理者更清楚货物流向,可为配送路径优化等决策提供支持。  相似文献   

18.
This paper proposes a novel traffic event classification approach using event severities at intersections. The proposed system basically learns normal and common traffic flow by clustering vehicle trajectories. Common vehicle routes are generated by implementing trajectory clustering with Continuous Hidden Markov Model. Vehicle abnormality is detected by observing maximum likelihoods of partial vehicle locations and velocities on underlying common route models. The second part of the work is based on extracting the severities of abnormality by deviation measurement using Coefficient of Variances method. By using abnormal event samples, two severity classes are built in order to recognize event severities by Support Vector Machines and k-Nearest Neighborhood algorithms. Experimental results show that the proposed model has high precision with satisfactory incident detection and event severity classification performance.  相似文献   

19.
链接预测是确定用户间关系的基本工具。通过相似性度量进行链路预测是一种常见的方法,提出一种基于相似度的链路预测算法,根据网络结构及拓扑特性来确定相似度,引入优化链路预测度量方法,将聚类系数作为网络结构性质。此外,并考虑共享邻域,得到较其他同类链路预测方法更好的性能。实验结果表明,提出的算法性能优于经典算法。结合在Facebook、Twitter与新浪微博等社交网络环境中的实验结果可知,SLP-CNP法较其他算法具有更优精度与效率。在未来的工作中,还可尝试在所提方法的基础上,提升在加权网络、有向网络和二部网络中的适用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号