首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 671 毫秒
1.
屠莉  陈崚 《计算机应用》2011,31(2):450-453
提出了一种流数据上的频繁项挖掘算法(SW-COUNT)。该算法通过数据采样技术挖掘滑动窗口下的数据流频繁项。给定的误差ε,SW-COUNT可以在O(ε-1)空间复杂度下,检测误差在εn内的数据流频繁项,对每个数据项的平均处理时间为O(1)。大量的实验证明,该算法比其他类似算法具有较好的精度质量以及时间和空间效率。  相似文献   

2.
滑动窗口是一种对最近一段时间内的数据进行挖掘的有效的技术,本文提出一种基于滑动窗口的流数据频繁项挖掘算法.算法采用了链表队列策略大大简化了算法,提高了挖掘的效率.对于给定的阈值S、误差ε和窗口长度n,算法可以检测在窗口内频度超过Sn的数据流频繁项,且使误差在εn以内.算法的空间复杂度为O(ε-1),对每个数据项的处理和查询时间均为O(1).在此基础上,我们还将该算法进行了扩展,可以通过参数的变化得到不同的流数据频繁项挖掘算法,使得算法的时间和空间复杂度之间得到调节.通过大量的实验证明,本文算法比其它类似算法具有更好的精度以及时间和空间效率.  相似文献   

3.
分组排序算法   总被引:3,自引:0,他引:3       下载免费PDF全文
提出了分组排序算法,详细分析了算法的原理及其时间与空间复杂度,得出了在最坏情况下的时间复杂度是θmn);最好情况和平均情况下的时间复杂度均是θnlog(n/mk));在最坏情况下的空间复杂度是O(mn-m2m);最好情况和平均情况下的空间复杂度均是O(mklog(n/mk));并用多组随机数据与效率较高的快速算法进行仿真对比实验,试验结果说明了文中结论的正确性。这一结果,将有助于进一步设计高效的海量数据分析方法。  相似文献   

4.
首先,提出了基于Vague等价关系的(αt,αf)-等价类,并在(αt,αf)-等价类基础上定义了(αt,αf)-粗糙集,得到(αt,αf)-粗糙集是λ-粗糙集的推广,研究了(αt,αf)-等价类和(αt,αf)-粗糙集的性质。其次,给出(αt,αf)-等价类分解、(αt,αf)-粗糙集分解以及(αt,αf)-粗糙集的边界的概念。最后,分别得到等价类、粗糙集以及粗糙集的边界基于Vague等价关系的分解结构。  相似文献   

5.
RMRZR0三个蕴涵算子为基础,研究了11种形式的三I算法的解,并在此基础上给出了这11种解的同一形式:B*(y)=SUP{A*(x)∧φx,y)},其中φX×Y→[0,1]表示某一函数,而且φx,y)与EY的选取依赖蕴涵算子Ri的选取。  相似文献   

6.
针对传统数据流挖掘算法不能挖掘出频繁项之间的关系而且挖掘时间和空间复杂度高、准确度不高的问题,本文提出了一种数据流中结构二叉树挖掘算法(AMST)。该算法利用了二叉树结构的优势,将所处理事务数据库中的数据流转化成结构化二叉树,然后利用数据流矩阵对结构二叉树进行挖掘。整个过程只对事务数据库进行了一次扫描,大大提高了挖掘的效率。此外,算法还找出了具有层次关系的频繁子树。实验结果表明,AMST算法性能稳定,在时间复杂度和空间复杂度方面有很大的优越性,能够快速准确地对数据流进行挖掘。  相似文献   

7.
一种有效的挖掘数据流近似频繁项算法   总被引:17,自引:0,他引:17  
数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,挖掘出所有准确的数据流频繁项通常是不可能的.提出一种新的挖掘数据流近似频繁项的算法.该算法的空间复杂性为O(ε-1),每个数据项的平均处理时间为O(1),输出结果的频率误差界限为ε(1-s+  相似文献   

8.
网格方法被多个进化算法用来保持解集的分布性。基于ε支配概念的ε-MOEA本质上也是基于网格策略的。虽然ε-MOEA通常情况下都能在算法性能的各方面之间取得较为合理的折衷,但是由于其存在固有缺陷,很多时候表现出不容忽视的问题——当PFtrue对某一维的变化率在该维不同区域的差异较大时,解集中边界个体或代表性个体丢失——严重影响解集的分布性。针对这一问题,定义了一种新的δ支配概念和虚拟“最优点”的概念,提出了一种新的网格存优策略,并将之应用于更新进化多目标归档算法的归档集。实验结果显示,基于新的存优策略的进化多目标归档算法(δ-MOEA)具有良好的性能,尤其在分布性方面比NSGA2和ε-MOEA好得多。  相似文献   

9.
单纯形搜索在遗传算法中的融合研究   总被引:2,自引:1,他引:1  
构造了单纯形混合遗传算法SM-HGA+。分析单纯形搜索算法,提出了单纯形交叉算子和K步随机单纯形搜索算子,并将单纯形搜索算法和这两个算子分别融入到最优微群体μPBt)、最差微群体μPWt)和普通群体PCt),形成SM-HGA+。最优微群体中的单纯搜索算法提高算法的精度;最差微群体中的单纯形交叉算子加速最差个体向优秀个体进化;普通群体中K步随机单纯性搜索提高全局搜索速度,同时在普通群体采用大交叉概率的标准遗传算法,提高全局搜索能力。遗传算法测试函数验证算法SM-HGA+的正确性、效率。  相似文献   

10.
提出一种基于几何特征的三维数据配准算法。该算法针对点云中各点pik邻近点Nbhd(pi)构造三棱锥体,将三棱锥体各侧棱pivjj=1,2,...,)和其中轴线pio的夹角记作θij,所有夹角按照右手系来依次形成夹角序列(θi1θi2...)作为三棱锥的几何特征。通过比较三棱锥体的几何特征来确定有效点对。算法实现时,首先对初始数据通过抽取有效点对,建立名义上的对应关系,然后采用四元组法求得坐标变换的旋转和平移矩阵,实现数据配准。  相似文献   

11.
基于改进的差别矩阵的快速属性约简算法   总被引:2,自引:1,他引:1       下载免费PDF全文
为了解决基于差别矩阵属性约简的计算效率问题,首先以计数排序的思想设计了一个新的计算U/C的高效算法,其时间复杂度降为O(|C||U|)。其次分析了基于差别矩阵的属性约简算法的不足,提出了改进的差别矩阵的定义,利用快速计算核属性算法生成的核属性和出现频率最多的属性来降低差别矩阵的大小,并设计了基于改进的差别矩阵的快速属性约简算法,证明了该新算法的时间复杂度和空间复杂度分别被降为max(O|C|2Σ0≤i相似文献   

12.
单体型组装MEC问题指如何利用个体的DNA测序片断数据,翻转最少的SNP位点值以确定该个体单体型的计算问题。根据片段数据的特点提出了一个时间复杂度为 O(nk22k2+mlogm+mk1)的参数化算法,其中m为片段数,n为单体型的SNP位点数,k1为一个片断覆盖的最大SNP位点数(通常小于10),k2为覆盖同一SNP位点的片段的最大数(通常不大于10)。对于实际DNA测序中的片段数据,即使mn都相当大,该算法也可以在较短的时间得到MEC问题的精确解,具有良好的可扩展性和较高的实用价值。  相似文献   

13.
对于图G_1、G_2,2色广义Ramsey数R(G_1,G_2)是指最小正整数P,使得每一个p阶的图G,或者G包含G_1,或者G的补图包含G_2。用改进的模拟退火算法求解得到了R(W_m,K_n),R(B_m,K_n),R(F_m,K_n),类型的一些Ramsey数的下界。  相似文献   

14.
相关反馈算法是图像检索不可缺的重要组成部分,是近来图像检索中研究的一个热点。提出了基于强化学习的相关反馈算法。根据强化学习中的Q_学习函数,建立矩阵Q,对每幅图像建立对应的一项Qii=1,2,…,n),记录每幅图像的本次检索中的累计反馈值,并根据加权特征法计算新的特征,对于每幅反馈的图像根据Q_学习函数计算其当前的累计反馈值。Q值越大即越与例子图像相关。由于强化学习是通过不断对环境的反馈来获得最佳的路径,这与相关反馈通过对用户检索意图的摸索来获得最优答案的思想一致。实验表明,提出的相关反馈算法具有更大的优越性。  相似文献   

15.
Apriori算法虽然在候选集的产生时利用了剪支技术,但每次扫描数据库时都必须扫描整个数据库,因此扫描的数据量大,速度较慢。Apriori-sort算法是在Apriori算法基础上的改进,基本思想是把事务数据库变为以度表示的事务度数据库,并对事务度数据库进行排序。Apriori-sort算法查找频繁项集时,只扫描数据库Dd中满足dCk)≦dTi)的事务。对扫描数据库进行了有效剪支,因此Apriori-sort算法的计算效率高。并用仿真数据对Apriori-sort算法和Apriori算法进行了仿真对比实验,实验结果证明了新算法的高效性。  相似文献   

16.
目前,基于基数排序的等价类划分算法有较低的时间复杂度但存在以下不足:属性值跳跃性大时会产生大量空队列;排序后仍需O(|PU|)的时间才实现划分,求出等价类,排序没能发挥应有作用。为此,设计了一种新算法,通过属性值映射避免大量空队列产生,通过增加一个记录等价类长度信息的计数数组,排序后仅需O(|U|)就可实现划分,求出等价类。整个算法时间复杂度为O(|CU|),空间复杂度为O(|U|),为求等价类划分提供了一个新的解决办法。  相似文献   

17.
属性约简的效率是粗糙集等软计算理论的核心问题之一。为了提高约简效率,在分析不可分辨关系和基数排序特点的基础上,提出了一种时间复杂度为O(|C||U|)的求核算法。然后,运用改进的属性重要度作为启发信息,得到一种快速的属性约简算法,时间复杂度为O(|C|2|U|)。最后,通过UCI机器学习库中的一些数据集对算法进行测试,证明了算法对大型的数据集进行属性约简的高效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号