首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对物联网环境下实时数据挖掘中资源约束的特点,分析了快速有效地挖掘抽取知识的方法。在K-means算法的基础上,结合RA-Cluster算法,提出了ARRA-Kmeans聚类算法。并基于环境资源约束和时间约束的特点,引入自适应聚类方法和滑动窗口技术,对网络节点的实时数据进行挖掘。实验结果表明,随着流数据量的增大,ARRA-Kmeans算法在处理实时动态的数据时具有较好的效果,聚类精度较高,处理时间较快。  相似文献   

2.
流数据挖掘技术是数据挖掘领域的新研究方向之一,而聚类研究又是其重要的内容。本文介绍了流数据基本特点,在统一流聚类表示模型的基础上,对现有流数据聚类算法进行了总结,并进一步提出了流数据聚类技术的研究方向和前景。  相似文献   

3.
基于图划分的网状高阶异构数据联合聚类算法   总被引:1,自引:0,他引:1  
目前已有的高阶联合聚类算法主要集中于分析星型高阶异构数据,然而实际应用中,存在大量网状高阶异构数据。为了有效挖掘网状高阶异构数据内部隐藏的结构,本文提出一种基于图划分的高阶联合聚类算法(简称为GPHCC),该算法将网状高阶异构数据的聚类问题转化为多对二部图的最小正则割划分问题。为了降低计算复杂度,将此优化问题转化为半正定问题求解。实验结果表明GPHCC算法优于目前已有的5种二阶联合聚类算法和5种高阶联合聚类算法。  相似文献   

4.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

5.
一种混合聚类算法及其应用   总被引:1,自引:0,他引:1  
通过分析基于网格与基于密度的聚类算法特征,提出了一种基于网格和密度的混合聚类算法,通过分阶段聚类并选取代表单元中的种子对象来扩展类, 从而减少区域查询次数,实现快速聚类。该算法保持了基于密度的聚类算法可以发现任意形状的聚类和对噪声数据不敏感的优点,同时保持了基于网格的聚类算法的高效性,适合对大规模数据的挖掘。实验数据分析验证了算法的有效性,对数据挖掘应用于设备状态监测和故障诊断具有指导意义。  相似文献   

6.
现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.  相似文献   

7.
聚类挖掘可以高效准确地从数据中找出很多潜在的、有价值的规律,但也同时存在着泄露用户隐私数据的安全威胁.已经有一些专门针对聚类挖掘的隐私保护研究,其中乘法扰动方法是一种准确性和安全性都较高的隐私保护算法.研究发现已知信息独立分量分析极大地降低了已有乘法扰动方法的安全性,它能够从乘法扰动数据中近似估计隐私数据.为了解决以上问题,提出了局部旋转扰动隐私保护算法,通过准确性分析得出新算法具有零损失准确性.利用安全性分析证明新算法能够有效抵御独立分量分析的攻击,具有更高的安全性.将新算法应用到聚类挖掘中,得到了与未加隐私保护的聚类挖掘非常接近的结果,说明了它的可行性.局部旋转扰动方法的出现,有效地解决了已有乘法扰动方法的安全漏洞,使得聚类挖掘能够更加安全地得到应用.  相似文献   

8.
提出了一种基于自组织特征映射( SOM)神经网络和模糊c-均值( FCM)的双层聚类方法,对Web日志中的日志数据集进行聚类。第一层是无监督SOM神经网络聚类方法,它所产生的类的个数大大减少了原始数据集的个数,降低了FCM对类初始中心点的依赖;然后利用FCM聚类算法的优势对第一层中产生的类的中心点进行聚类,从而大大减少了聚类的时间复杂度;最后通过平行坐标技术可视化展示聚类前后的日志数据集,方便对日志数据进行分析。  相似文献   

9.
提出了一种基于自组织特征映射(SOM)神经网络和模糊c-均值(FCM)的双层聚类方法,对Web日志中的日志数据集进行聚类.第一层是无监督SOM神经网络聚类方法,它所产生的类的个数大大减少了原始数据集的个数,降低了FCM对类初始中心点的依赖;然后利用FCM聚类算法的优势对第一层中产生的类的中心点进行聚类,从而大大减少了聚类的时间复杂度;最后通过平行坐标技术可视化展示聚类前后的日志数据集,方便对日志数据进行分析.  相似文献   

10.
为快速准确地提取和挖掘信息系统运维服务过程中的关键咨询问题,本文利用分布式技术,基于Hadoop的客服运维文本聚类算法,对海量文本数据进行聚类研究。给出了基于Hadoop的运维数据分布式并行计算模型,并在Hadoop框架中对系统中所有运维数据进行分析处理。同时,给出了分布式文本聚类算法,并以10万余条电力信息系统运维数据为数据源,对设计的分布式聚类算法和传统聚类算法进行分析对比。实验结果表明,本文设计的分布式聚类算法所需时间低于传统聚类算法,不仅解决了传统聚类算法在处理海量数据方面由于数据规模过大引起的速度慢、效率低的问题,而且还借助大数据中蕴含的价值和动力,提升了企业运维服务水平。该研究具有较高的实用价值和理论意义。  相似文献   

11.
First, the Multi-Dimension Division Code algorithm is proposed. If there are many tags and many collisions, by using this algorithm, the number of times by which the reader calls each tag and the data used will be greatly decreased. With more and more collisions, the AVG number of TIMES by which the reader searches for one tag will tend to a limit: 4/3,and the data with which the reader searches for one tag will tend to a constant. Second, the adaptive Multi-Dimension Division Code algorithm is proposed. The adaptive Multi-Dimension Division Code algorithm can adaptively decrease the MDDC dimensions according to the numbers of the tags, and can encode the tags again. The adaptive Multi-Dimension Division Code algorithm will greatly improve the efficiency of searching for one tag, whether in many collisions or in few collisions. So the adaptive Multi-Dimension Division Code algorithm is a very good algorithm for searching for one tag in the RFID system.  相似文献   

12.
在自适应维分编码原理的基础上,证明了维分编码维重Q=4是最优的.标签越多,维分编码的维数就越多.为此文中给出了标签数量估计和维数估计方法,同时还给出了自适应维分编码降维后标签的降维编码算法以及自适应维分编码的解码算法,为自适应维分编码原理的完善做了正确和必要的研究,因此,完善的自适应维分编码算法无论标签数目较多和标签数目较少时,都能大大提高阅读器搜索标签的效率.  相似文献   

13.
针对地球同步轨道卫星发射-低轨道卫星被动接收的异构双基合成孔径雷达系统中,由于收发时延长和接收机速度快导致的“走-停”假设不成立,复杂成像几何下回波信号在距离向和方位向具有严重空变性的问题,提出一种基于二维时域扰动的改进线性调频变标成像算法.首先基于双基观测几何推导出非“走-停”假设下的信号模型;然后通过时域扰动的方法校正回波二维空变性;最后对残余相位进行补偿.仿真实验表明,该算法可实现高低轨双基合成孔径雷达高分辨率宽幅场景的良好聚焦,且具有很好的保相性能.  相似文献   

14.
为提高彩色图像的整体感官效果,在研究CES(Color image Enhancement by Scaling)算法出现块效应的原因基础上,提出了一种改进算法,即各向异性扩散滤波器的ICES(Improved Color image Enhancement byScaling)。与CES相比,ICES算法在不增加计算复杂性的前提下,不仅得到了不逊于CES算法的增强效果,还能极大地抑制块效应。  相似文献   

15.
特异性因子是数据的重要特征之一,常通过累计数据之间的差异得到,是面向特异性挖掘的核心概念,然而遇到了计算时间复杂度过高的问题。本文在分析已有特异性因子定义特点及其计算算法时间复杂度的基础上,指出应该基于采样的方法定义特异性因子。给出了一种基于采样的特异性因子定义,即采样特异性因子(sampled peculiarity factor,SPF),并提出了一种基于SPF的异常检测算法。在真实数据集上进行对比实验,结果表明:该算法在检测异常数据时,精度降低不明显,而运行效率得以较大提高,这说明基于采样定义特异性因子的方法可行和更为合理。本文还指出采用合适的采样方法可经进一步优化SPF的计算过程,进而节约占用CPU时间和满足实时性要求高的应用。  相似文献   

16.
0roAtpresent,thernostpopulaxSARprocessingtech-niqUesistheIang-DoPPler(RD)algorithm,especiallyitSmedifiedversionwiththesecondeqrmgecomPression.ThernaindisadvantagesofRDalgorithInarethesec0ndnyrmgecompressioncarinteasilyincooprateazimuthfre-qUencydePendencet',']andtheinteIPOlatorinrmgecellhagrationcorrectionreqUiressignificantcomPutationtimeandleadst0lossofimageqUality.TheWaveeqUational-gorithIn['Jisth..ti..ll;theoptimum,buttheSt0ltmaP-pinginfreqUencyd0Inainismorecriticalandcausesthe…  相似文献   

17.
针对当前基于CUDA的中值滤波并行加速算法存在的编程复杂,图像数据提取和显示环节实现繁琐等问题提出了利用MATLAB和OpenACC结合的并行算法。该算法采用MATLAB实现图像的提取并转换成数组文件,之后利用OpenACC实现串行代码到并行代码的转换并处理MATLAB转换的数组文件,最后通过MATLAB将滤波后的数据显示成图像。通过仿真实验进行中值滤波算法的加速实验,结果表明:提出的算法在大量减少代码转换工作量的情况下加速效果较串行程序提升明显,且与CUDA加速效果相当。  相似文献   

18.
针对旋转设备原始故障特征空间中存在的冗余特征问题,提出一种基于支持向量数据描述(SVDD)和遗传算法的故障特征优化方法. 通过理论和实验分析构造了相对完备的设备声学故障特征空间;依据特征可分离性评价准则和SVDD识别率从原始故障样本数据集中提取出先验知识,指导种群的初始化;以类〖JP9〗内-〖JP〗类间距离判据和故障分类器的识别率评价种群中个体的适应度,在此基础上建立改进的遗传算法搜索最优故障特征子集.基于转子振动台所模拟的不平衡故障实验样本数据集,验证了该方法的有效性.  相似文献   

19.
提出一种基于粒子群优化算法的图像矢量量化码书设计算法.该算法引入粒子群的全局搜索策略,结合矢量量化码书设计方法,增加了算法解的随机性和多样性.实验结果显示,本算法与传统LBG码书设计算法相比,具有更强的鲁棒性,可有效解决LBG算法对初始码书的依赖性,能获得性能较好的码书.  相似文献   

20.
提出了一种适合于话音和数据用户并发的蜂窝CDMA系统的呼叫接纳控制算法。该算法将数据业务,新到达的语音业务,切换的语音业务进行区分对待,设置不同的剩余带宽门限值。当新呼叫或切换呼叫到达时,首先估计当前系统剩余的带宽,然后根据不同类别业务与不同门限值进行比较,决定是否对该呼叫进行接纳。最后通过仿真对门限值的不同设定进行了比较分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号