排序方式: 共有105条查询结果,搜索用时 15 毫秒
101.
基于滑动窗口的数据流闭合频繁模式的挖掘 总被引:11,自引:1,他引:11
频繁闭合模式集惟一确定频繁模式完全集并且数量小得多,然而,如何挖掘滑动窗口中的频繁闭合模式集是一个很大的挑战.根据数据流的特点,提出了一种发现滑动窗口中频繁闭合模式的新方法DS_CFI.DS_CFI算法将滑动窗口分割为若干个基本窗口,以基本窗口为更新单位。利用已有的频繁闭合模式挖掘算法计算每个基本窗口的潜在频繁闭合项集,将它们及其子集存储到一种新的数据结构DSCFI_tree中,DSCFI_tree能够增量更新,利用DSCFI_tree可以快速地挖掘滑动窗口中的所有频繁闭合模式.最后,通过实验验证了这种方法的有效性. 相似文献
102.
本文介绍了联机分析处理OLAP的概念,分析了联机处理在数据仓库中的应用,比较了几种形式的OLAP。文中着重介绍了一种利用基于维层次树创建高性能DH-Cube的方法,详细讨论了它的创建、增量更新及快速查询算法。与其他立方体存储方式相比,此方法节省了系统的存储空间,提高了MOLAP的查询速度及立方体的更新速度,减少了维护费用。基于多维数据库的OLAP的应用研究@雷明菊$南京东南大学计算机系数据库及信息系统研究室!210096
@胡孔法$南京东南大学计算机系数据库及信息系统研究室!210096
@董逸生$南京东南大学计算机系数据库及信息系… 相似文献
103.
提出了一个利用多个拉格朗日乘子协同优化的支持向量机快速学习方法(MLSVM),并给出了每个乘子的可行域范围的定义公式,由于在每个乘子的优化过程中使用了解析表达式,使得算法可以更加精确和快速地逼近最优解,可以证明SMO算法是该方法的一个特例.在此方法的理论指导下,根据不同的学习策略,程序实现了3种不同的具体算法(MLSVM1,MLSVM2,MLSVM3),其中前两个算法在数据集不大时(〈5000条记录)学习速度与SMO算法相当,但当数据集更大时,算法就失效了.MLSVM3是一个改进算法,总结了MLSVM1和MLSVM2失效的原因,对SMO算法中学习效率较低的部分进行了改进,在多个数据集上测试,MLSVM3算法速度超过了SMO算法7.4%~41.30%. 相似文献
104.
基于演化计算的XML数据的关系存储 总被引:5,自引:0,他引:5
随着XML规范的制定和推广,XML数据管理技术受到数据库界广泛重视,XML数据的存储是XML数据管理的关键.研究了利用数据库技术和人工智能技术,为XML数据的关系存储提供一种灵活的策略.首次提出了代价驱动的基于遗传算法的关系存储策略CDGABRS,针对不同的用户和查询模型,产生不同的映射模型方案,引进遗传算法,计算对应的系统开销,从中求出使系统的存储代价和查询代价最优的关系存储方案.实验证明了CDGABRS方法的可行性和高效性. 相似文献
105.
为了实现自动化的数据质量评估,提出了一种在背景范围内的数据质量量化方法QDC(Quantify Dimensions within Context)。数据质量可以用数据和其对应实体的“完美表达”间的差距来衡量。由于“完美表达”很难获得或代价很高,因此提出在多数据源条件下,数据的“完美表达”可以在其背景范围内用投票获得的“最近似”来替代,从而确定了数据质量评估参照的标准。同时提出利用信息论中信息熵指标,将不同类型数据的质量维度统一为通用的度量。作为一种自动化的数据质量评估方法,QDC方法不仅能够对数据的准确性和完整性维度给出准确的评估值,并且具有很高的计算效率。 相似文献