首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
用于数据仓储的一种改进的多维存储结构   总被引:7,自引:2,他引:7  
冯建华  蒋旭东  周立柱 《软件学报》2002,13(8):1423-1429
对于数据仓库中数据的物理存储组织,目前主要有关系和多维数组两种方式.这两种方式各有自己的优缺点,从提高联机分析处理(online analytical processing,简称OLAP)查询处理性能的角度出发,多维数组方式相对较优,目的主要是解决数据仓库的多维存储结构问题.针对当前多维数组存储组织方式存在的一些问题,提出了Cube(立方体)逻辑存储和物理存储的概念,首先将原多维数据空间划分为逻辑子空间,逻辑块再划分为多个物理块.在物理存储时充分考虑了多维数组的大容量和高稀疏度的问题,并采用新的多维数组的分布和压缩方法.这些概念和方法有效地解决了维内部层次结构的聚集操作和Cube操作的效率问题,显著提高了涉及维内部层次的聚集查询的响应速度,同时还解决了增量维护的效率问题.  相似文献   

2.
随着信息技术的发展,信息系统日趋复杂和多样化,这给访问控制的设计和维护提出了更高的要求。概念格作为一种重要的数据挖掘和知识发现方法,具有自动聚类和自动构建层次的特点,可以用于设计和维护一个访问控制所需要的层次结构。本文对概念格在强制访问控制和基于角色的访问控制中的相关研究进展进行了分析和总结,并对未来的研究趋势进行了讨论。  相似文献   

3.
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进概念学习模型的应用效果。通过阐述概念学习过程和语义空间的层次性质,归纳层次概念学习的四类计算模型:基于条件熵的文本层次概念抽取;建立语言资源的概念层次和神经网络的隐含层次之间的映射;通过迭代的随机过程拓展主题模型;在正则化因子中添加语义关系约束。通过概念学习综述得出如下结论:层次性的语言模型广泛结合了显明和隐含的概念表示方法;统计模型和语言资源的语义映射是拓展层次结构的主要路径;层次结构具有双曲空间和嵌套球形结构;层次结构分析可以提升统计模型的解释水平。  相似文献   

4.
在数据仓库建设中,维度的层次结构建模关系到数据组织、存储、分析和展现,甚至会影响到数据挖掘的应用,是一个相当重要的设计过程.文章针对政府决策支持系统建设中常见的非齐整非平衡及混合的层次结构建模作了较深入的分析和研究,论述了采用星型模型和雪花模型实现非齐整非平衡及其混合层次结构的建模方法,并结合例子具体实现了在Oracle数据仓库中的类层次结构建模.  相似文献   

5.
面向领域的数据挖掘系统研究   总被引:1,自引:0,他引:1  
通过将领域工程、领域框架、面向对象技术、软件构件技术及数据挖掘相结合,提出了一套面向领域的数据挖掘系统开发模型及一个类似于OSI网络参考模型的新型挖掘层次结构,并且设计了一个面向领域的数据挖掘系统框架,有效地解决了以上问题。  相似文献   

6.
数据挖掘技术在军事指挥控制系统中的应用   总被引:2,自引:0,他引:2  
本文介绍了数据挖掘的概念、数据挖掘的过程和方法,分析了数据挖掘在军事指挥控制系统中的应用,提出了军事应用中数据挖掘的层次体系结构和指挥控制系统中数据挖掘的应用模型。  相似文献   

7.
数据挖掘软件应用分析   总被引:3,自引:0,他引:3  
随着计算机在线业务处理和数据库技术的发展,出现了大量数据和信息存储。要解决如何从海量的数据中发现有用的信息问题,促使了数据挖掘软件的出现。  相似文献   

8.
基于MapX的空间数据挖掘模型及其应用   总被引:7,自引:0,他引:7  
利用Mapx控件对GIs数据强大的操作与处理功能,将Mapx应用到空间数据挖掘中,构建了基于MapX的空间数据挖掘模型。通过该模型可以方便的对空间数据与非空间数据进行操作处理,以及空间对象之间的拓扑关系与距离信息等进行判定,从而解决了空间数据挖掘中数据整合与数据预处理的问题。概念泛化技术应用于数据预处理中,构建了概念层次树。关联规则算法有效应用于空间数据挖掘中.荻取了有用的知识。  相似文献   

9.
为提高数据挖掘服务选择的匹配度,提出了一种基于数据挖掘本体的带QoS约束的数据挖掘服务选择方法。方法引入了数据挖掘服务本体,给出了数据挖掘服务描述模型,定义了一种基于数据挖掘本体和QoS约束的数据挖掘服务匹配层次分类方法和服务匹配度计算方法,有效解决了数据挖掘服务选择中服务匹配的问题。实验表明,该方法可行且具有较高的查全率和查准率。  相似文献   

10.
中文检索系统中查询的扩展   总被引:3,自引:0,他引:3  
本文基于向量空间模型,提出了根据类别体系的层次结构,将特征项进行层次存储利用特征项所示的概念范畴的不同,以用户原始查询做进一步的扩展,文中详细介绍了用户查询扩展的方法,给出了查找某一特征项的下两层子特征项的算法。  相似文献   

11.
用探测性的归纳学习方法从空间数据库发现知识   总被引:6,自引:0,他引:6       下载免费PDF全文
将探测性数据分析,面向属性的归纳和Rough集方法结合起来,形成了一种灵活通用的探测性归纳米学习方法EIL,可以从空间数据库中发现普遍知识,属性依赖,分类知识等多种知识,同时提出了和总结了多种生成空间数据库概念层次结构的方法用于归纳学习,用中国分省农业统计数据的发掘试验说明了EIL的可行性和有效性。  相似文献   

12.
关系数据获取是一个很重要的研究领域。为了提高挖掘的针对性和有效性,提出了一种基于属性取值域层次划分的元组概念与属性值概念的交替获取方法。这些属性取值域上的划分是关系中所蕴涵的重要信息。另外,从属性取值域的层次划分出发,定义了一类扩展的关系-粗值关系。每个元组概念都是某个粗值关系中的概念外延。因此,元组概念获取可转化为构造关系的概念格,并证明一个关系与某些粗值关系的横向并的概念格等于它们各自概念格的横向并。由简单概念格的并构造复杂概念格可减少构造概念格的复杂性。  相似文献   

13.
Knowledge Representation in KDD Based on Linguistic Atoms   总被引:11,自引:0,他引:11       下载免费PDF全文
  相似文献   

14.
数值型数据的泛概念树的自动生成方法   总被引:35,自引:0,他引:35  
概念层次在数据挖掘中有着重要的作用 .通过自动生成概念层次 ,可有效地提高数据挖掘的效率 ,在不同层次上发现知识 .文中介绍基于云模型的数值型概念表示方法 ,通过云模型的期望值、熵和超熵三个数字特征有效地表达定性概念 ,并实现定性和定量的不确定转换 .通过云变换实现了泛概念树中叶结点的自动生成 ,并自动构造数值型数据的泛概念树 .同时 ,进一步研究了泛概念树中的概念爬升和跳跃的方法 ,为通过数据挖掘发现各层次知识提供了基础 .  相似文献   

15.
基于多维数据模型的交叉层关联规则挖掘   总被引:3,自引:0,他引:3  
多层关联规则是带有一定概念分层的关联规更哇,它描述了不同抽象级别上数据项之间的关联性,且不同级别上的关联性具有不同的指导意义.但目前已讨论的多层关联规则,大都局限于挖掘同一抽象层上数据项之间的关联,因而,针对这一问题,本文对已有的FP—Tree算法进行扩充和改进,实现了既能挖掘同一抽象层上也能挖掘不同抽象层上数据项之间关联性的多层关联挖掘算法,即交叉层关联规则挖掘算法FP—Tree*.同时,在算法实施之前,还结合多层关联挖掘本身的特点,对现有的数据存储结构进行改进,提出用字符序列对事务项编码的方法,从而简化了大量的数据预处理工作.  相似文献   

16.
在面向属性归纳(AOG)的数据挖掘中,属性归约及概念归纳都离不开概念层次.而概念层次一般都是先验的,当出现概念层次中没有的新的概念时,无法进行归纳.以属性论为基础的概念相容测度,将概念层次单纯的文字表示转换为其定性基准的表示,给出了名称型属性的概念层次树的动态生成算法.当有新的属性值出现时,可以不用重新生成概念树,只需调用该算法,将新的属性值插入已有概念层次树即可.从而可以让概念归纳与修改概念层次同时进行,使AOG具有了动态归纳的特性.  相似文献   

17.
用语言云模型发掘关联规则   总被引:55,自引:0,他引:55  
该文提出用语言云模型用于KDD中知识表达和不确定性处理,引入了多维云模型作为一维模型的扩展.语言云的数字特征量将语言值的模糊性和随机性用统一的方式巧妙地综合到一起,基于云模型的概念层次结构可以跨越定量和定性知识之间的鸿沟.为了发现强关联规则,属性值要在较高的概念层上泛化,同时允许相邻属性值或语言项间有重叠.这种软划分可以模仿人类的思想,使发现的知识具有稳健性.将基于云模型的泛化方法与Apriori算法结合起来,从空间数据库中发掘关联规则.试验显示了其有效性、高效性和灵活性.  相似文献   

18.
概念分层在人口普查数据中的应用   总被引:1,自引:0,他引:1  
宾晟  刁树民  于忠清 《计算机工程》2005,31(15):232-232,F0003
介绍了数据挖掘技术及人口普查的基本概念,阐述了概念分层的相关概念及算法,并将其应用在人口普查数据中。探讨了概念分层应用于人口普查数据中的重要意义及概念分层中的若干问题。  相似文献   

19.
Discovering Frequent Closed Partial Orders from Strings   总被引:2,自引:0,他引:2  
Mining knowledge about ordering from sequence data is an important problem with many applications, such as bioinformatics, Web mining, network management, and intrusion detection. For example, if many customers follow a partial order in their purchases of a series of products, the partial order can be used to predict other related customers' future purchases and develop marketing campaigns. Moreover, some biological sequences (e.g., microarray data) can be clustered based on the partial orders shared by the sequences. Given a set of items, a total order of a subset of items can be represented as a string. A string database is a multiset of strings. In this paper, we identify a novel problem of mining frequent closed partial orders from strings. Frequent closed partial orders capture the nonredundant and interesting ordering information from string databases. Importantly, mining frequent closed partial orders can discover meaningful knowledge that cannot be disclosed by previous data mining techniques. However, the problem of mining frequent closed partial orders is challenging. To tackle the problem, we develop Frecpo (for frequent closed partial order), a practically efficient algorithm for mining the complete set of frequent closed partial orders from large string databases. Several interesting pruning techniques are devised to speed up the search. We report an extensive performance study on both real data sets and synthetic data sets to illustrate the effectiveness and the efficiency of our approach  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号