首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
在现有的算法DBSCAN基础上,提出一种基于密度的处理购物篮事务数据的聚类方法-DCMBD(density-based clustering for market basketdata)。使用了一种新的事务表示法,解决了购物篮数据的高维性和稀疏性问题。并对算法进行了相应的改进,从而提高了聚类速度。实验结果表明此方法是有效可行的。  相似文献   

2.
基于ART1人工神经网络的数据聚类   总被引:5,自引:1,他引:5       下载免费PDF全文
本文对数据聚类进行了研究,提出了一种利用ART1人工神经网络的数据聚类方法的结构和算法。  相似文献   

3.
袁柳  张龙波 《计算机科学》2015,42(10):266-270, 296
如何有效管理并利用日益庞大的RDF数据是当今Web数据管理领域面临的挑战之一。对大规模的RDF数据集进行聚类操作从而得到数据集的有效划分是RDF数据存储和应用时通常采取的策略。针对现有RDF聚类过程中忽略RDF三元组自身模式特征的问题,在对RDF聚类结果的形式深入分析的基础上,定义了3种不同类型的聚类模式,从而提出基于模式的聚类方法。通过对RDF数据集的重新描述,自动生成适用于RDF数据集特征的聚类模式,在此基础上实现数据聚类的任务。在不同测试集上的实验结果验证了所提方法的正确性和有效性。  相似文献   

4.
基于流数据的模糊聚类算法   总被引:1,自引:0,他引:1  
对流数据进行有效聚类是一个吸引研究者很大注意力的问题.传统的聚类挖掘算法只能适用于纯数值属性数据或纯分类属性数据,很难适用于混合属性的数据.针对混合属性数据的特点,在借鉴AcluStream算法的基础上,提出了一种模糊聚类算法.算法对流数据的相异度分类度量,定量属性使用欧氏距离和曼哈坦距离度量,定性属性可以采用hamming距离度量.模糊聚类算法的主要步骤有两步:第一步,运用最小距离聚类算法进行聚类,构成一个初始类.第二步,对基于最小距离聚类算法进行聚类所得到的初始簇,运用密度聚类方法进行聚合或分割,使得聚类集合稳定.实践证明:该算法是快速地有效的.  相似文献   

5.
流数据是动态的、不断发生变化的,如果能够及时发现流数据聚类模型的变化,并报告给用户发生了哪些变化,可以帮助用户制定出更好的策略。针对该需求,本文提出一种流数据变化检测策略,该策略充分利用簇统计信息CFT检测变化,比较变化后新聚类模型与原模型之间的差异,分别报告出每一个簇的具体变化,其时间复杂度为O(K2),实验证明该机制能够较为直观报告出变化的结果。  相似文献   

6.
高效、可靠的数据隐藏防护能够有效防止电网数据中心主动泄密。现有的数据隐藏方法隐藏数据元冗余程度高,且稀疏程度低。针对数据隐藏特征冗余和高效表征的难题,提出一种基于内容感知聚类的电网中心数据隐藏防护方法,构建支持向量机的电网数据压缩架构,采用正交回归的电网数据聚类系数,通过仿真和实验搭建,验证基于内容感知聚类的电网中心数据隐藏防护方法能够有效提升数据聚类的效率和准确度。  相似文献   

7.
通常,经典的数据聚类算法在低维情况下是有效的,但随着维数的增加,性能和效率都明显的下降,原因在于数据的复杂度是呈指数增长。本文提出了一个处理高维数据聚类的框架,并分析了该框架的性能。  相似文献   

8.
提出一种能够有效处理大规模分布的数据聚类问题且简化计算复杂度的分阶段非线性聚类方法,该算法包含两个阶段:首先将数据划分为若干个球形分布的子类,采用K近邻图理论对原始数据计算顶点能量并提取顶点攻能量样本;再采用K近邻算法对该高能量样本做一个划分,从而得到一个考虑高能量样本的粗划分同时估计出聚类的个数,最后,综合两次聚类结果整理得到最终聚类结果。该方法的主要优点是可以用来处理复杂聚类问题,算法较为稳定,并且在保持聚类正确率的同时,降低了大规模分布数据为相似性度量的计算代价。  相似文献   

9.
根据目前数据挖掘研究的现状,分析不确定数据的聚类挖掘算法。针对不确定数据聚类挖掘存在的问题,提出改进传统的数据挖掘算法来适合不确定数据的聚类挖掘或找出新的聚类挖掘算法,来解决不确定数据聚类挖掘问题的新思路。  相似文献   

10.
基于模糊聚类的侦察数据分析方法   总被引:1,自引:0,他引:1  
利用模糊聚类方法对案件侦察数据进行了分析,解决了侦察数据自动聚类分析问题.重点探讨了侦察数据模型的建立和聚类过程,以及根据类密度均匀、类间有断裂层设计了一个隶属度函数,从而确立了数据对象的隶属关系,并给出了一个具体的模糊聚类算法.该方法能够对侦察数据进行合理分类,分类效果比较明显.并且,在真实的刑事案件侦破过程中得到了应用,应用效果良好.  相似文献   

11.
容器云受到风险攻击会影响运维性能,无法有效保护内部存储的隐私数据安全。为了准确判断风险攻击类型,最大程度保证用户隐私数据安全,提出基于历史数据分析的容器云安全风险评估方法。根据云计算安全标准,对容器云风险等级进行分类;利用粗糙集算法挖掘容器云历史数据中的风险因素,获得风险因素归约集合;根据容器云的运行特点,通过德尔菲方法和决策隶属度矩阵计算安全风险权重。根据各风险间存在关联性,整合整体风险评估值,实现容器云安全风险评估。实验结果表明,该方法可以有效评估容器云安全风险,且评估结果较为准确,为用户保证隐私数据安全提供参考。  相似文献   

12.
在信息化时代,数据是信息化潮流真正的主题,企业已经把关键数据视为正常运作的基础.一旦数据泄密,那么会给企业带来难以估量的损失.本文简要介绍在企业局域网中,数据的安全保护,以及具体的解决方案.  相似文献   

13.
新时期下人们对计算机数据安全提出了更高的要求,以往的网络安全模式存在一定的弊端,未能很好地发挥出保护作用。基于此,文章重点对基于区块链技术的计算机数据安全保护进行探讨,从区块链技术相关概述入手,分析计算机数据安全保护中常见的密码学技术及区块链技术的应用,最后提出基于区块链技术的计算机数据安全保护方案,希望为相关人员提供参考借鉴,在计算机数据安全保护中积极应用区块链技术,全面推动计算机数据安全的保护效果。  相似文献   

14.
一种基于复杂网络的网络安全态势预测机制   总被引:1,自引:0,他引:1  
针对现有态势预测方法大都是对态势值的预测,并未揭示网络态势要素动力学特征的问题,提出了一种基于复杂网络的网络安全态势预测机制,可方便而又直观地追溯安全态势中数值波动的动力学特征.其次在该机制中提出基于复杂网络的马尔可夫预测方法,实现对安全状态的有效预测.通过仿真实验分析,该机制在一定程度上能突出系统的本质行为,且能较准确地预测未来的安全状态.  相似文献   

15.
网络安全态势感知(SA)的研究对于提高网络的监控能力、应急响应能力和预测网络安全的发展趋势具有重要的意义。基于态势感知的概念模型,详细阐述了态势感知的三个主要研究内容:网络安全态势要素提取、态势理解和态势预测,重点论述各研究点需解决的核心问题、主要算法以及各种算法的优缺点;最后对各研究点的相关理论及其应用实现的发展趋势进行了分析和展望。  相似文献   

16.
为了解决传统聚类方法在多维数据集中聚类效果不佳的问题,提出了将网络社团划分的方法,并应用到多维数据聚类分析中。对于一个多维数据集,首先对分析对象进行特征提取,构建出每个对象的特征向量,通过计算皮尔森相关系数来度量不同特征向量之间的相似性,从而构建出一个相似性网络,采用Blondel算法对该网络进行社团划分达到聚类的效果。实验结果表明该方法可以在多维数据聚类中得到较好的聚类结果,准确率达到92.5%,优于K-means算法的75%。  相似文献   

17.
面向聚类的数据隐藏通常使用数据扰动技术防止敏感信息泄露。针对现有的面向聚类的数据扰动方法隐私保护度低的问题,提出一种基于平面反射的数据扰动方法,将发布对象的全部属性两两配对构成平面上的点,再随机选择一条直线,作每对属性关于直线的对称点,转换后的数据即为发布的数据。实验结果表明,这种方法具有较好的隐私保护度和聚类可用性,且对高维数据有良好的适应性。  相似文献   

18.
一种基于累加PSO-SVM的网络安全态势预测模型   总被引:1,自引:0,他引:1  
在网络安全态势感知系统中,态势预测是关键的环节.为了保证及提高态势预测的精度,结合粒子群算法的寻优性能好和支持向量机的预测准确的优势,提出了一种在数据累加预处理基础上的PSO-SVM预测模型.此模型利用将原始序列累加,弱化了原始序列中的不规则扰动影响,增强了序列的规律性的特点,与粒子群优化支持向量机(PSO-SW)相结合,更好地发挥预测精度高的优势,更能保证预测精度.通过仿真实验检验此模型的有效性,并与PSO-SVM预测模型的结果进行对比,验证了其预测精度的优越性.  相似文献   

19.
随着网络的迅速发展和信息化进程的深入,信息资源得到了最大程度的利用和共享,但不可否认的是紧随信息化发展而来的网络安全问题日益突出。本文对信息网络常面临的安全问题进行了列举和原因分析,并有针对性地提出了信息网络安全的几点防护策略。  相似文献   

20.
田华  何翼 《计算机应用研究》2020,37(12):3586-3589
针对大数据分析在大规模并行分布式系统和软件平台上可扩展的问题,提出了一个基于无参数围绕质心二进制分裂聚类(clustering using binary splitting,CLUBS)的大数据挖掘技术。该技术以完全无监督的方式工作,基于最小二次距离的准则进行分裂聚类将数据与噪声分离,通过中级精炼来识别仅包含异常值的块并为剩余块生成全面的簇,设计CLUBS的并行化版本以实现对大数据进行快速有效的聚类。实验表明CLUBS并行算法不受数据维度和噪声的影响,且比现有算法具有更好的可扩展性且速度较快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号