首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统预测方法无法有效预测Web舆情的长期趋势中拐点的不足,提出一种长期趋势预测方法.该方法首先通过周期分析和层次聚类为每类已发生舆情事件的发展趋势建立类模型库,然后通过对待预测舆情事件已知发展趋势进行自适应变换后,应用最小二乘法从相应的类模型库中选取均方误差和最小的模型来预测该事件的未来发展趋势.实验证明,与传统方...  相似文献   

2.
由于分布式发电的特性及影响,在电力系统控制当中能否对负荷特性做出准确的预测讲变的十分关键.通过对电力系统负荷特性常用的聚类的方法如K-means、凝聚型层次聚类等深入的研究,针对这几种算法,利用国际IRIS、曲线聚类审定通用指标、实际的特性曲线聚类结果 3个算法进行了验证,从而总结出含有分布式电源的系统电力负荷曲线高兴率聚类算法.  相似文献   

3.
为解决现有的分布式聚类算法效率低下和不能保护数据隐私的问题,在K-Dmeans算法的基础上,提出一种新的分布式聚类算法.该算法利用数据对象间的密度函数值来优化站点初始聚类中心,从而大大降低了聚类的迭代次数;同时各从站点只需向主站点传送其聚簇的特征信息,有效降低分布式聚类过程中的通信量,保护了各个站点的独立性,实验结果表...  相似文献   

4.
针对工业数据去除噪声预处理问题,提出了基于密度聚类的数据筛选方法.该方法通过计算各样本数据间的空间距离而获得数据空间的分布密度情况,根据密度聚类法按密度分布聚类,聚类的中心点即为筛选获得的研究数据.实验表明,基于密度聚类的数据筛选法选取数据可以克服环境噪声干扰,筛选数据准确可靠,适用于工业数据的预处理.  相似文献   

5.
针对微信息舆情所面临的扭曲心态多发、公信力受损、技术死角多等严峻问题,在大数据条件下,利用分布式网络的MapReduce架构设计出虚拟式蜜罐防御模型和相关检测算法,实现监管角色成功介入,能够主动导引用户兴趣方向并预测新舆情倾向,并提出建设舆情监测适用机制的有效措施.结果表明:蜜罐式主动防御系统具有显著的导引功效,检验效率较高,针对性较强,能获得较好的监测效果,加强微信息舆情的主动性防范能力,提高舆情管理部门的公信力和舆情调节控制能力,为微信息监管提供重要的支持.  相似文献   

6.
随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的噪声点。文章提出了一种Hadoop平台环境下基于网格密度的分布式数据流聚类算法(PGDC Stream),利于基于Hadoop的MapReduce框架对数据流进行阶段化的并行聚类分析,实时发现数据流中任意形状的簇,定义检测周期和密度阈值函数并及时删除数据流中的噪声点。算法基于网格密度对数据流初始聚类后,随着新数据的到来,使用基于密度阈值函数的噪声点处理策略,周期性检测和删除噪声点,使用基于Hadoop MapReduce框架的并行分析模型周期性地调整已经生成的簇。实验结果表明,PGDC Stream对大规模数据流的聚类质量、可伸缩性和实时性都好于CluStream。   相似文献   

7.
云架构数据中心网络流量具有种类繁杂的特点,应用传统的流量调度方法存在丢包率高、CPU利用率低的问题,为此利用分簇聚类技术实现对网络流量调度方法的设计.分别从控制层、核心层、聚合层、边缘层四个层级,搭建云架构数据中心网络的拓扑结构.检测云架构数据中心网络流量,并结合检测结果利用分簇聚类技术实现对网络流量的聚类处理.通过分...  相似文献   

8.
对回归预测、决策树、神经网络、聚类和邻点预测、规则导引等5种数据挖掘预测算法分别进行介绍,并结合实例对各种方法适用情况进行了比较,以便有针对性地对客户行为采用有效的预测方法.其中:回归预测根据历史记录分析得出总体趋势;决策树方法是一种“二分制”数据分析和预测方法,主要用于对数据进行归类分割和预测,来解决定性分析的问题;神经网络方法主要对客户行为进行分析和预测,从定量的角度进行分析.  相似文献   

9.
针对现有的数据流聚类算法不能在线实时生成用户需要的聚类结果问题,提出一种基于滑动窗口的数据流在线聚类算法.该算法采用密度网格存储结构,实现了数据流的在线聚类过程,能实时地向用户提供聚类结果,动态地检测数据流的进化情况.实验结果表明,该方法具有快速在线聚类能力,并能保证良好的聚类质量.  相似文献   

10.
基于co-ICIB联合聚类的舆情监测系统的设计为舆情信息库,它通过联合聚类等数据挖掘算法可以快速及时地发现新的舆论热点.当舆论热点被确认,即在互联网上真正成为一个备受关注的话题时,文本分类算法可以将同一话题内的信息归类,有助于跟踪舆情的发展趋势.该舆情监测系统可为舆情监管部门提供原始舆情资料、数据性图表和建议性分析.  相似文献   

11.
传统的聚类算法在全空间下的聚类过程倾向于输出单一的聚类结果,高维数据在不同的子空问多视图下往往呈现不同的数据结构.文中引入空间的正交化方法实现在不同子空间上的并行化,构建密度树聚类,以提供对数据集在多维子空间视图下聚类结果的多样性观测,通过F-measure值引导用户确定不同子空间中感兴趣的聚类结果.真实数据集上的实现结果证明了上述方法的有效性.  相似文献   

12.
针对聚类神经网络初始权值与样本分类数的设定问题,提出一种基于网格和密度的聚类神经网络结构优化算法.以网格和密度为工具提取聚类样本的聚类中心,并由此确定样本分类数,从而对聚类神经网络结构进行优化,可以有效地提高神经网络的聚类效果,缩短样本聚类时间.  相似文献   

13.
数据挖掘技术中聚类算法的改进研究   总被引:1,自引:0,他引:1  
针对K-means算法所存在的问题进行了深入的研究,提出了基于密度和聚类对象方向的改进算法(KADD算法).该算法采取聚类对象分布密度方法来确定初始聚类中心,然后根据对象的聚类方向来发现任意形状的簇.理论分析与实验结果表明,改进算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果.  相似文献   

14.
针对垂直划分的分布式数据库提出了一种基于隐私保护的分布式聚类算法PPDC-VP,该算法基于K-Means的思想实现分布式聚类,并且聚类过程中应用扰乱技术保护本站点真实信息不被传送到其它站点,从而达到隐私保护的目的.理论分析和实验结果表明PPDC-VP算法是有效的.  相似文献   

15.
窃电行为检测的主要目的 在于发现窃电用户,降低电力系统运营成本.在此背景下,提出基于改进模糊C均值聚类的窃电行为检测模型,包括因子分析、基于改进模糊C均值聚类的局部离群因子计算、ROC曲线模型评价与调参及最佳检测阈值选取等模块,适用于无大量已知窃电用户样本的情况.首先,通过因子分析对用户用电特征(包括用电负荷数据和电能表异常事件)进行维度规约,提升模型检测效率.再利用遗传模拟退火算法对模糊C均值聚类算法进行改进,对用户用电特征进行检测.最后与现有成熟算法进行比较,验证该模型对窃电行为具有较高的检测准确度.检测模型可输出所有被测用户用电行为离群度得分和窃电概率排序,利用该文检测模型的输出,能够以较高精度检测出窃电行为用户,根据结果进行现场稽查,可提升反窃电工作效率.  相似文献   

16.
针对密度峰值聚类算法在处理分布不均匀数据集时聚类性能不佳且不能自动确定聚类中心的问题,提出基于共享邻域的密度峰值聚类算法(DPC-SN)。首先,考虑数据点的局部邻域信息和数据点间的相关性,根据共享邻域重新定义局部密度;其次,给出了新的决策阈值作为区分聚类中心和非聚类中心的临界值,自动获取聚类中心;最后,在不同分布特征的合成数据集和UCI数据集进行实验验证。结果表明,该算法聚类精度和总体性能优于基于K近邻的密度峰值聚类(DPC-KNN)、原始密度峰值聚类(DPC)、K均值聚类(K-means)和基于密度的聚类(DBSCAN)4种算法。  相似文献   

17.
基于模糊聚类理论的水量短期预测方法   总被引:3,自引:0,他引:3  
为提高城市供水系统水量负荷的预测精度,提出一种基于模糊聚类理论的城市管网水量短期负荷预测的新方法.该方法通过对负荷历史数据进行聚类、隶属度分析,利用模糊聚类参数来描述负荷与影响因素之间的关系,并应用这种确定的相关关系进行负荷预测.应用MATLAB语言进行预测仿真得到基于模糊聚类的模糊训练结果、最终预测结果和预测误差.实践表明该方法较多地考虑各种影响因素,结构简单,预测精度高.  相似文献   

18.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

19.
从数据挖掘的基本技术着手,分析了K-means聚类算法、基于相似度的聚类算法和蚁群聚类算法的特点,探讨了3种聚类算法在入侵检测系统中的应用步骤、计算方法,并通过实验测试,验证了3种算法对未知入侵行为检测的可行性。  相似文献   

20.
随着电网规模的扩大,数据量的急剧增加,漏采、误采等不良数据及数据冗余会对短期负荷预测产生负面影响,造成预测准确度下降,预算结果无法正常使用.针对这些现象,提出一种基于多层聚类和改进BP神经网络的负荷预测模型.该模型基于多层聚类对原始数据进行预处理,选取形成与待预测数据相似的样本数据集,建立基于改进BP神经网络的预测模型.多层聚类模型减小了输入改进BP神经网络的数据量,避免了不良数据对预测模型造成的影响,预测模型更贴近待预测数据特点;改进BP神经网络避免了在训练过程中陷入局部最小解.预测结果表明:相比模糊C均值聚类方法,多层聚类与改进BP神经网络的负荷预测方法提高了预测精度与预测速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号