排序方式: 共有113条查询结果,搜索用时 15 毫秒
1.
研究了如何使用SP-Feature来压缩序列模式。SP-Feature是一种简洁表示序列模式的新颖结构。一种新的相似性度量被用来聚类SP-Feature,同时也给出了SP-Feature的合并方法。基于层次聚类框架,设计了一种有效的挖掘压缩序列模式的算法CSP。在真实和模拟数据上的大量实验表明CSP能够快速有效地压缩序列模式(在稠密数据集上的恢复误差小于4%)。 相似文献
2.
1 Web仓储的时新性标准 WWW的迅猛发展使其成为全球信息传递与共享日益重要的信息资源。Web仓储使用物化视图构建信息集成系统,是对Web信息进行充分利用的一种有效方法。Web仓储具有高稳定性,查询速度非常快,非常适合决策分析等需要对信息进行深度加工的应用。与使用虚视图方法进行集成的系统不同,Web仓储系统中的首要任务是物化视图的构建和维护,而视图刷新则是物化视图维护工作的主体。 相似文献
3.
一种无线通信环境中用户移动模式的挖掘算法 总被引:3,自引:0,他引:3
发现无线通信环境中用户的移动模式是移动对象管理中的一个关键问题.提出一种快速挖掘该模式的算法SAM(split and merge),用来挖掘移动对象所产生有序数据集中潜在的移动模式,从而为移动对象管理提供服务.该算法将自底向上搜索和自顶向下过滤技术相结合,采用图存储压缩数据集方法,利用非频繁项集分解子图和频繁长模式过滤数据集相结合的技术,大大减少了迭代次数,降低了CPU时间.最后给出了算法性能比较和算法分析.结果表明,该算法是有效的. 相似文献
4.
1.引言作为目前信息表示和交换的标准,XML得到越来越广泛的应用。对XML进行管理,传统的方法是利用文件系统。目前,传统的关系数据库在市场上仍占有主流地位,如何利用关系数据库来管理XML数据成为现实的问题。由于XML文档本质上是基于图模式的半结构化数据,而目前商用数据库管理系统管理的是基于关系模式的结构化数据,利用关系数据库来管理XML数据可能带来非常高的存贮代价和查询代价,因此利用关系数据库来管理XML数据必须解决两种异构模式之间的转换问题,生成合理的关系模式。对于上述问题,工业界和学术界从不同的角度进行了研究,文Oracle 8i利用关系数据库引擎来完成XML文档的简单查询,但是,Oracle 8i的当前版本要求手工生成XML文档所对应的关系模式,增加了使用人员的负担。 相似文献
5.
6.
论文元数据信息的自动抽取 总被引:16,自引:1,他引:16
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。 相似文献
7.
ADTree是一种基于boosting的决策树学习算法,其预测准确率比一般决策树高并可以给出预测置信度,在实际中有广泛的应用.已有的ADTree构建算法能有效地处理小规模数据,但对于大规模数据的处理非常低效.因此提出了一种新的ADTree构建算法--BICA(bottom-up induction for constructing ADTree),设计了新的数据结构和自底向上的归纳方法,并将其结合到ADTree建树过程中,能够快速地进行分裂测试评估,从而有效地提高ADTree的构建效率.实验证明,BICA对大规模数据集的处理效率明显优于已有ADTree构建算法,能够进行高效的处理. 相似文献
8.
物化视图的刷新是Web仓储进行系统维护的一项主要任务,而基础数据变化频率则是刷新方案中的重要因素.在已有文献中,研究者已经给出一些关于基础数据变化规律的算法和估测器.虽然这些估测器取得了不错的效果,然而他们却忽略了这些估测器都有一定的适用范围,超出这个范围则效果急剧下降.在此,基于泊松过程进行分析,对估测器的适用范围进行了讨论,根据估测结果的偏离值和有效性对估测公式进行参数调整,同时根据估测值的大小不断调整数据源的访问频率和次数,从而使数据源访问模式和估测器互相适应,使估测器在最佳估测范围内获得估测值.实验结果表明,与已有文献中的方法相比,新提出的自适应估测算法能够取得更好的效果. 相似文献
9.
基于Boost和信任函数的多文本分类器组合模型 总被引:2,自引:0,他引:2
人们对文本分类已经进行了大量的研究,取得很多研究成果,设计多种分类器,达到相当高的分类精确度。但使用单分类器进行文本分类有一些缺点,如分类模型对样本的敏感性,而且单分类器的分类精度很难再有很大的提高。因此,使用多分类器以提高分类的精度是一个非常活跃的研究领域。文章提出使用近年在传统概率统计方法之上发展起来的信任函数理论和方法对多个文本分类器进行组合使用。具体方法是使用信任函数将分类结果进行综合,得到最终的分类结果。实验证明,基于信任函数的信息综合方法比已有的方法更合理,精度也得到提高。 相似文献
10.
基于XML的本体表示和检索技术的研究 总被引:10,自引:0,他引:10
基于XML和本体在抽象层次上都可以用带标签的有向图来表示,文章提出了用XML来描述本体,并在此基础上实现对本体中概念的检索。 相似文献