首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 359 毫秒
1.
彭行雄  肖如良 《计算机应用》2016,36(12):3476-3480
针对仿真生成算法采用静态分布模型生成Web日志,会造成与真实数据之间存在较大差异的问题,提出一种基于用户兴趣迁移的Web日志仿真生成(WLSG)算法。该算法首先对Web日志与时间的关系进行了建模;其次,模拟了用户在不同时间访问文件时用户的兴趣迁移;最后,也模拟了用户自适应访问当前时刻最感兴趣的文件。相对于现有的采用静态分布模型的仿真算法,所提算法能够提高自相似性指标约2.86%。实验结果表明,该算法通过用户的兴趣迁移来改变用户的访问序列,能够较好地模拟真实Web日志,有效地应用于Web日志的仿真生成。  相似文献   

2.
字段关联的构建方法是Web数据逼真生成中的困难问题.提出一种基于MIC的字段优先关联的Web数据逼真生成算法.该算法与现有的方法完全不同:首先,提取真实Web日志数据集中相应字段间的MIC系数;然后,结合字段的重尾特性,采用SE分布对字段的重尾性进行建模;最后,建立字段关联模型,模拟出真实数据集中的字段间依赖性,从而逼真生成目标数据集.实验表明,生成的数据集能够保持合理的字段间的均衡性以及节点间的相似性.  相似文献   

3.
目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但 还没有研究涉及 一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。  相似文献   

4.
序列数据是一种重要的数据类型,在诸多领域都有应用,比如说文本、生物数据库以及Web访问日志等。在对该类型数据进行分析的时候,对于相关信息的获取一般都是通过相似性查询得到的。本文首先根据序列查询算法的特点,提出了SSQ_MF,也就是多重过滤算法。并在此基础上设计了最优过滤顺序模型和过滤集大小估计的相关实验。实验结果表明,SSQ_MF算法的查询性能优于单一过滤器算法和随机过滤顺序的多过滤器算法。  相似文献   

5.
当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈.针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件.实验结果表明,该算法的加速比能随着数据集的增大而提高,其执行效率优于串行FP-growth算法.  相似文献   

6.
在构建虚拟场景时,树木是不可缺少的景物.传统的树木分形生成算法计算复杂、耗时长,不适于在构建实时动态的场景中使用.文中提出了一种在L系统分形算法基础上的树木模型参数化生成方法.该算法将树木模型先进行参数化处理,然后将分形计算产生的树木模型数据按层次储存起来,并根据视点与树模型的距离确定所需树木模型数据的层次,从而充分发挥了应用分形技术生成的树模型真实感强的优点,消除了分形计算耗时长的缺陷,保证了树木生成的真实性和实时性.对分形生成过程中遇到的随机数生成周期性及相似性问题给也给出了解决方法.  相似文献   

7.
Web日志分析系统不仅能改进Web网站结构,提高Web服务器性能,而且能识别用户的喜好、满意度,发现潜在用户,增强网站服务竞争力。介绍了Web日志挖掘的各个阶段,设计并实现了一个Web日志分析系统。分析了传统的频繁项集挖掘算法与序列模式挖掘算法的不足之处,根据日志数据的特性,将用户属性引入频繁项目集的生成过程,有效地减少了候选项集的数目,并根据候选集的特点,逐轮压缩数据库。将连续序列引入到ApiroriAll算法的候选集合并过程中,实现了改进算法。通过实验比较了改进算法与传统算法的效率,证明了改进算法的有效性。  相似文献   

8.
基于多重分形的聚类层次优化算法   总被引:2,自引:0,他引:2  
闫光辉  李战怀  党建武 《软件学报》2008,19(6):1283-1300
大量初始聚类结果之间存在强弱不同的相似性,会给用户理解与描述聚类结果带来不利影响,进而阻碍数据挖掘后续工作的顺利展开.传统聚类算法由于注重聚类形状及空间邻接性,或者考虑全局数据分布密度的均匀性,实际中均难以解决这一类问题.为此,提出了基于分形的聚类层次优化算法FCHO(fractal-based cluster hierarchy optimization),FCHO算法基于多重分形理论,利用聚类对应多重分形维数及聚类合并之后多重分形维数的变化程度来度量初始聚类之间的相似程度,最终生成反映数据自然聚集状态的聚类家族树.此外,初步分析了算法的时空复杂性,基于合成数据集和标准数据集的有关实验工作证实了算法的有效性.  相似文献   

9.
序列数据一类重要的数据类型,在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种获取有用信息的重要手段.在大型序列数据库中进行高效相似性查询的关键因素之一就是查询算法的过滤能力,即设计能快速过滤与查询序列不相关序列集的过滤器十分重要.提出了结合序列距离的度量性质和序列自身特征的多重过滤算法SSQ_MF,SSQ_MF使用了长度过滤器、前缀过滤器和基于参考集的过滤器,使得算法过滤能力较基于单一过滤器算法进一步增强.此外,设计了有关数据结构对查询数据库的一些统计信息进行了预计算和保存,有效估计了各过滤器的过滤集大小,并构建了一个由过滤集大小确定的最优过滤顺序模型,使得算法的过滤代价最低.实验结果表明,算法SSQ_MF的查询性能优于单一过滤器算法和随机过滤顺序的多过滤器算法.  相似文献   

10.
金融数据的分形实证分析   总被引:1,自引:0,他引:1  
文章利用分数(形)布朗运动(Fractal Brownian Motion:FBM)模型来描述金融数据的变化。确定了无标度区间的方法。该方法精度较镐,实用性好。利用FBM模型估计了大量股票价格数据的分形维数,估计结果表明:股票价格数据在一个较大的尺度范围内呈现自相似性,我国股票价格的分形维数大约为1.5-1.7。  相似文献   

11.
基于小波域混合高斯模型的自相似流量合成算法   总被引:1,自引:0,他引:1  
自相似流量特性对网络性能具有重要影响,流量建模与合成是网络性能评价的基本环节.提出了一种基于小波域混合高斯模型的自相似流量建模与合成方法:小波变换的近似Karhunen—Loeve(K-L)变换特性可以有效去除流量过程的长程相关,而混合高斯模型准确地描述了小波系数的非高斯分布.对合成流量进行了统计分析以及排队性能仿真.实验表明该方法能够更准确地对通信流量进行建模和合成,并且具有运算量小(O(N))、流量生成快速等优点.  相似文献   

12.
本文分析了网络通信量中存在的自相似现象,并讨论了自相似通信量的预测及其对于网络性能分析的重要意义,提出了一种考虑了网络通信量自相似性的自适应预测方法,该预测方法在利用通信量自相似性的同时也考虑了通信量的短程相关特性,能够对实际通信量进行良好的预测。最后用实验仿真验证了这种方法在通信量预测中的有效性。  相似文献   

13.
基于小波变换的网络流量预测模型   总被引:4,自引:0,他引:4       下载免费PDF全文
胡俊  胡玉清  肖中卿 《计算机工程》2008,34(19):112-114
目前研究发现实际网络流量具有明显的分形特性,流量的多重分形特性对网络性能有着非常重要的影响,有必要建立一个基于多重分形特性的可以同时预报长相关和短相关特性的实际网络业务模型。利用AR, ARMA等模型对短相关数据能较好地预测而对长相关数据预测精度不高的特点,并结合小波变换能够去除实际数据相关性,建立新的预测模型,使其对长相关数据同样具有比较高的预测精度。改进后的模型克服了FARIMA模型计算量比较大的缺点,保持了算法的简单性。  相似文献   

14.
基于小波的多尺度网络流量预测模型   总被引:25,自引:0,他引:25  
洪飞  吴志美 《计算机学报》2006,29(1):166-170
通过把ARIMA线性预测方法引入小波域内,提出一个基于多重分形小波模型的网络流量预测模型。通过对真实网络流量的仿真实验,结果表明该模型能够对网络流量进行比较精确的预测.  相似文献   

15.
王星  符颖  陈游  周一鹏  呙鹏程 《控制与决策》2018,33(11):1941-1949
针对先验信息不完整的非合作电子对抗背景下的低截获概率雷达信号识别问题,提出一种基于多重分形和半监督最大期望(EM)的识别算法.该算法计算出信号的多重分形谱,提取出信号的多重分形谱参数特征;针对EM算法中全部未标记样本集的加入会造成收敛速度缓慢甚至有可能影响到分类精度的缺陷,引入Self-training思想,提出一种基于Self-training的半监督EM算法.该算法通过挑选最为确定的一个或多个未标记样本来更新样本集,使得未标记样本集不断缩小进而加快分类器的训练速度,也可有效避免错误的累加,在一定程度上可提高分类精度.理论分析和仿真结果表明,在LPI雷达信号识别问题上,所提出的算法在不同的信噪比下具有更高的分类识别率和更好的实时性.  相似文献   

16.
为了高效控制工质出口温度,维持换热器稳定运行,针对Smith预估控制算法及径向基函数(RBF)神经网络辨识单神经元比例-积分-微分(PID)控制算法特点,提出了Smith控制算法和RBF神经网络辨识单神经元PID相结合的控制策略,对Smith控制算法在结构上进行了改进,以提高RBF神经网络辨识单神经元PID控制的抗干扰能力,减少Smith控制算法对模型的依赖程度.仿真分析表明:应用于换热器工质出口温度控制系统,改进算法控制性能显著优于其它控制方法,抗干扰能力得到了大幅提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号