首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 718 毫秒
1.
为了从用户地理空间分布数据中挖掘用户间关联关系,提出了一种基于谱聚类的关联关系挖掘算法.首先定义了关联度,用以衡量用户之间空间分布的相似性,基于关联度构造相似矩阵,再利用谱聚类方法对用户进行聚类分析,聚类结果表征了用户的关联关系.采用Silhouette指标和聚类准确率来衡量用户关系挖掘质量,同时与传统的K-Means方法进行了比较,通过真实数据集实验,结果表明该算法在实验数据集上能达到90%以上的聚类准确率,证明方法有效、可行.  相似文献   

2.
为了提高物联网区块链数据挖掘能力,需要进行数据优化聚类处理,提出基于深度学习的区块链数据分片峰值聚类算法.采用异构有向图分析方法进行物联网区块链数据存储结构设计,结合特征空间重组技术进行物联网区块链数据结构重组,提取物联网区块链数据的关联信息特征量,采用语义相关性融合的方法进行区块链数据特征提取和自适应调度,对提取的物联网区块链数据特征量进行模糊聚类处理,采用模糊C均值聚类方法进行物联网区块链数据的网格分片峰值聚类和属性分类识别,采用深度学习方法进行数据聚类过程中的分片峰值融合和聚类分析,实现区块链数据分片峰值聚类.仿真结果表明,采用该方法进行区块链数据分片峰值聚类的收敛性较好,误分率较低,自适应学习能力较强.  相似文献   

3.
针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采样并加噪,再通过填补取值域随机排列发布算法打乱采样数据的初始顺序,使恶意攻击者不能根据用户与数据之间的关系识别出目标用户。然后,尽可能减小噪声的干扰,利用循环迭代的方式计算出新的质心完成聚类。最后,从理论层面上分析了以上3种方法的隐私性、可行性和复杂度,并利用3个真实数据集和近年来具有权威性的同类算法KM、DPLM、LDPKM等进行准确率、熵值的对比,验证所提方法的有效性。实验结果表明,所提方法的隐私保护和发布数据质量均优于当前同类算法。  相似文献   

4.
柯霖 《电子设计工程》2023,(24):163-167
针对电力工程项目智能化监理管控问题,提出了一种基于FCM-IFA-SVM算法的电力工程数据处理与风险识别模型。该模型利用FCM算法对环境风险、技术风险、经济风险与管理风险等指标数据进行聚类分析,并采用IFA算法优化了SVM模型的惩罚系数及核函数参数。将聚类后的数据集输入至已完成参数优化的SVM模型中,进而得到电力工程项目风险等级的评估结果。通过对某电力工程数据集的仿真测试结果表明,所提算法在风险识别方面具有更高的准确率。同时相比于SVM和FCM-SVM算法,其平均准确率分别提升了7.1%及2.9%,说明所提算法能更准确地识别并评估电力工程项目风险等级。  相似文献   

5.
为了解决联邦学习过程中数据异质性导致模型性能下降的问题,考虑对联邦模型个性化,提出了一种新的基于相似度加速的自适应聚类联邦学习(ACFL)算法,基于客户端本地更新的几何特性和客户端联邦时的正向反馈实现自适应加速聚类,将客户端划分到不同任务簇,同簇中数据分布相似的客户端协同实现聚类联邦学习(CFL),从而提升模型性能。该算法不需要先验确定类簇数量和迭代划分客户端,在避免现有基于聚类的联邦算法计算成本过高、收敛速度慢等问题的同时保证了模型性能。在常用数据集上使用深度卷积神经网络验证了ACFL的有效性。结果表明,所提算法性能与聚类联邦学习算法相当,优于传统的迭代联邦聚类算法(IFCA),且具有更快的收敛速度。  相似文献   

6.
《现代电子技术》2019,(8):145-150
针对传统K-means聚类算法对高维非线性数据聚类效果不佳、聚类时间消耗大的问题,文中对高维数据的预处理进行研究,提出一种基于深度信念网络(DBN)的K-means聚类算法(DBNOK)。此算法首先使用多层受限玻尔兹曼机(RBM)对数据进行特征学习,并将学习到的隐含特征进行K-means相关参数和初始聚类中心进行交叉迭代优化。用DBNOK算法分别在低维数据集和高维数据集上进行实验,结果表明,DB-NOK算法聚类准确率优于标准的K-means算法和模糊均值聚类(FCM)算法。  相似文献   

7.
张聿晗  李艳雄  江钟杰  陈昊 《电子学报》2021,49(10):2041-2047
音频场景聚类的任务是将属于相同音频场景的音频样本合并到同一个类中.本文提出一种基于联合学习框架的音频场景聚类方法.该框架由一个卷积自编码网络(Convolution Autoencoder Network,CAN)与一个判别性聚类网络(Discriminative Clustering Network,DCN)组成.CAN包括编码器和译码器,用于提取深度变换特征,DCN用于对输入的深度变换特征进行类别估计从而实现音频场景聚类.采用DCASE-2017和LITIS-Rouen数据集作为实验数据,比较不同特征与聚类方法的性能.实验结果表明:采用归一化互信息和聚类精度作为评价指标时,基于联合学习框架提取的深度变换特征优于其他特征,本文方法优于其他方法.本文方法所需要付出的代价是需要较大的计算复杂度.  相似文献   

8.
随着网络用户的日益增多,许多互联网企业甚至事业部门需要使用用户画像来对不同网络用户进行心理刻画来了解用户.但用户画像算法一般存在着聚类算法的簇值必须手动指定以及无效关键字过多的问题.因此文章设计了一种新的基于网络行为的用户画像方法.该方法首先会对搜集到的用户数据进行分类;接着设计算法自动确定簇值,并将簇值代入聚类算法与...  相似文献   

9.
张彤  沈倩  王琼 《电子设计工程》2024,(6):100-103+108
针对传统人工核查电力工程异常数据存在耗时费力及准确度较低的问题,文中提出了一种基于模糊聚类与改进遗传算法的数据识别技术。该技术采用模糊聚类算法对数据进行自动归类,并对异常数据加以识别。同时还设计了一种改进遗传算法增强了数据的全局搜索能力,进而提升整体算法的识别效率。基于Matlab进行的仿真验证结果表明,所提技术方案可有效地自动识别出电力工程中的异常数据。而在结合改进遗传算法后,该算法的识别准确率得到了显著提升,且识别时间也缩短了60%以上,实现了数据搜索能力与效率的平衡。  相似文献   

10.
网络用户随时间变化的行为分析是近年来用户行为分析的热点,通常为了发现用户行为的特征需要对用户做聚类处理。针对用户时序数据的聚类问题,现有研究方法存在计算性能差,距离度量不准确的缺点,无法处理大规模数据。为了解决上述问题,该文提出基于对称KL距离的用户行为时序聚类方法。首先将时序数据转化为概率模型,从划分聚类的角度出发,在距离度量中引入KL距离,用以衡量不同用户间的时间分布差异。针对实网数据中数据规模大的特点,该方法在聚类的各个环节针对KL距离的特点做了优化,并证明了一种高效率的聚类质心求解办法。实验结果证明,该算法相比采用欧式距离和DTW距离度量的聚类算法能提高4%的准确度,与采用medoids聚类质心的聚类算法相比计算时间少了一个量级。采用该算法对实网环境中获取的用户流量数据处理证明了该算法拥有可行的应用价值。  相似文献   

11.
《现代电子技术》2016,(23):116-120
校园网中的服务器存有海量的用户访问日志文件,记录了校园网用户的访问信息。鉴于此,提出了一种基于聚类算法的校园网用户行为分析技术,设计和实现了数据预处理系统,对日志数据进行一系列的清理、合并,标准化等预处理,使其更好地适应后续的聚类操作。将预处理后的数据作为输入数据,分别实现了三种常用的聚类算法对日志数据进行聚类,然后从聚类准确率和聚类速度两个角度对现有算法进行优化。为了提高聚类准确率,提出了用K-均值算法结合AGNES算法的方法;为了提高聚类速度,在MPICH2平台上设计和实现了并行K-均值算法,实现多机并行分析,最后简单介绍了校园网行为分析系统的应用。  相似文献   

12.
个性化服务中的并行K-Means聚类算法   总被引:1,自引:0,他引:1  
K-Means聚类算法在基于Web日志的个性化服务领域得到广泛的应用,但是在处理海量数据过程中,传统的(单机)K-Means聚类算法存在着可扩展性差、效率低下、运行时间长等缺点,在充分研究传统K-Means聚类算法的基础上,发现K-Means聚类算法中蕴含的并行性,提出了一种基于用户的并行处理K-Means聚类算法,并将该并行算法应用到个性化服务中对网站用户进行聚类,有效地缩短了用户聚类的时间。  相似文献   

13.
为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和最佳任务调度的Web数据聚类算法。该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法。先通过数据压缩形式降低Web数据的复杂性,再进行基于服务时间相似性的时间序列数据聚类;最后针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。仿真实验结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚类算法,该文的算法在聚类时间、聚类精度、服务执行成功率、聚类失真度上均获得了更好的性能。  相似文献   

14.
基于学习向量量化(Learning Vector Quantization,LVQ)单次迭代聚类效果不稳定和随着数据维度增大,聚类效果下降的缺陷,采用了一种深度强化学习优化的LVQ聚类算法。将LVQ算法的每一次迭代看做深度强化学习的一个状态,LVQ算法初始化一组原型向量后,用原型向量与数据集中每一个数据点做“拉近”或“远离”运算来完成一次迭代。优化算法挑选一部分数据点,并与原型向量做运算,将这一过程作为一个动作,选取的数据子集不同,产生的动作也不同,把这些动作组成动作集,选定动作后,根据奖赏函数找到最佳动作,进入下一状态。通过对UCI公共数据集和碳碳沉积数据集试验,得出优化后的算法FMI提升3%到10%,Dunn指数提升2%到9%,准确率提高3%到6%,用于公共数据集及碳碳沉积材料的生产过程数据分析性能较优。  相似文献   

15.
将半监督学习应用到应用流分类问题中,提出了一种基于半监督聚类的应用流分类算法(PSOSC).首先采用粒子群优化的K均值聚类方法对大量的无标记数据和少量的标记数据进行聚类,利用少量标记数据确定簇与应用类型的映射关系,实现应用流分类.实验表明PSOSC算法有较高的流准确率,同时,降低了对标记数据的需求.  相似文献   

16.
基于兴趣度的Web用户聚类方法   总被引:1,自引:1,他引:0  
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果.  相似文献   

17.
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度.  相似文献   

18.
针对传统串行聚类集成算法在处理高维海量数据时效率低下的问题,提出基于Spark的并行聚类集成算法SCEA(Spark based Clustering Ensemble Algorithm).首先,通过主成分分析与成对约束结合的方法对算法输入数据进行预处理,达到数据降维并去除特征相关性的目的;其次,通过调用不同聚类算法获得基聚类成员后,采用三元组方法通过基聚类成员的簇标签构造出相似度矩阵,并调用层次聚类算法得到最终的聚类结果;最后,在调用MLlib中已有聚类算法的基础上,基于Scala对SCEA算法进行了实现.将SCEA与同类算法在多组数据集下进行对比测试,实验结果表明:总体上SCEA不仅较已有算法在准确率方面有所提高,并且通过分析运行时间、加速比以及可扩展性3个性能指标,证明了SCEA在算法性能上的优越性.  相似文献   

19.
头发分割是图像分割领域的一大挑战,头发的自动分割对辅助性别分类、身份识别、医疗影像分析以及头部重构、AR染发等都有着重要的意义.基于机器学习方法对头发进行自动化分割是该领域的常用方法,具有效率高性能好的优点.文章梳理了基于早期机器学习的传统头发自动分割方法与基于深度学习的头发自动分割方法的发展历程,重点分析了贝叶斯网络图模型、区域生长算法、聚类算法、图割算法等传统分割方法以及全连接神经网络、全卷积神经网络、U-Net、MobileNet等基于深度学习的分割方法,并归纳对比各方法的分割效果、优缺点和发展方向.基于深度学习的头发分割方法需要使用大体量的数据集对网络进行训练,文章整理了头发分割常用公开数据集的各项属性,并对各方法使用不同数据集的各项分割性能进行对比.在此基础上,对基于机器学习的头发自动分割所面临的困难和挑战进行梳理和分析,针对存在的问题提出解决思路,对该领域的发展前景加以展望.  相似文献   

20.
针对数据稀疏性问题,提出基于蚁群聚类的项目评分预测方法.在对Web日志分析基础上将用户聚类,针对目标用户的未评分项目,找到目标用户的若干最近邻类簇,利用类簇内其他用户对目标项目的评分预测未评分项目的评分,从而达到降低数据稀疏性目的.最后,结合协同过滤思想设计了相应的推荐算法,并用从自主开发的旅游电子商务网站上收集的数据进行试验仿真.实验结果表明,与其它缓解数据稀疏性的方法相比,文中的方法显著提高了推荐精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号