排序方式: 共有113条查询结果,搜索用时 15 毫秒
41.
XML在数据交换中的应用越来越广泛,但由于标记引入而使其空间膨胀较大,对传输及存储资源耗费严重.压缩后的XML数据容量明显减少,但怎样基于压缩后的XML数据直接进行查询及处理,仍然是需要深入研究的问题.以反向算术压缩为基本压缩算法,提出针对XML数据库中压缩XML文件的索引结构Interval ,基于该索引结构,可高效实现对类似element1element2…elmentm的查询处理. 相似文献
42.
对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之处,而点对敏感聚类模型(pair-wise cluster)算法复杂度是NP难的问题而设计.核心聚类模型将数据集合中的点划分为若干不相交的核心点集和边界点集,同一核心点集内任意点对的相似度大于阈值σ,而不同核心点集的点对相似度小于阈值σ.核心聚类模型挖掘出的核心点集是紧密类簇,并且具备良好的分类性质.由于采用了局部优化算法,核心聚类模型的算法复杂度为O(n2),较点对敏感的最大相关成员簇聚类模型大大降低.同时,可以通过核心点集和边界点集构造最大相关成员簇的上界,这就在一定程度上保证了核心聚类模型结果的完备性.实验和分析对比说明核心聚类模型具有较高的算法效率,可扩展性强,结果表示合理,能够很好地解决现实应用问题. 相似文献
43.
电信企业信息化中数据仓库技术的应用 总被引:4,自引:0,他引:4
本首先阐述了电信企业信息化中系统整合的三个层次,并分析了数据仓库技术的重要性,然后介绍了数据仓库的一些基本概念,通过对客户关系管理,欺诈行为分析,网络故障分析,计费系统分析等,介绍了数据仓库技术在电信行业的应用。 相似文献
44.
在基于多维数据的分析中,分析人员面对的经常是庞大的数据立方体.联机分析处理虽然提供了灵活的展现和分析功能,却只能进行假设驱动的探查,很容易忽略重要信息.而已有的发现驱动的探查是基于局部异常的导航,容易受数据噪声的干扰.针对这些问题,提出了一种新的导航方法——异常分布驱动的导航.这是一种有效的辅助探查数据立方体的方法,可以循序渐进地引导用户至信息量大的数据部分.它将维和维成员作为探查数据立方体的脉络,基于数据分布特征为各个维和所有维成员计算奇异度,作为用户探查数据立方体的导航符.实验结果表明此导航方法是实用有效的. 相似文献
45.
46.
47.
数据管理技术的重要方向 总被引:3,自引:0,他引:3
数据管理技术是信息技术发展的基础。据统计,企业数据规模正以每年200%的速度增长,且90%是非结构化内容数据(如文档、音视频流等)。与此同时,为了有效地利用数据,人们迫切需要一个经过整合的综合信息基础架构。为了满足这些需求, 相似文献
48.
In many sensor network applications,it is essential to get the data distribution of the attribute value over the network.Such data distribution can be got through clustering,which partitions the network into contiguous regions,each of which contains sensor nodes of a range of similar readings.This paper proposes a method named Distributed,Hierarchical Clustering (DHC) for online data analysis and mining in senior networks.Different from the acquisition and aggregation of raw sensory data,DHC clusters sensor nodes based on their current data values as well as their geographical proximity,and computes a summary for each cluster.Furthermore,these clusters,together with their summaries,are produced in a distributed,bottom-up manner.The resulting hierarchy of clusters and their summaries facilitates interactive data exploration at multiple resolutions.It can also be used to improve the efficiency of data-centric routing and query processing in sensor networks.We also design and evaluate the maintenance mechanisms for DHC to make it be able to work on evolving data.Our simulation results on real world datasets as well as synthetic datasets show the effectiveness and efficiency of our approach. 相似文献
49.
50.