首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 953 毫秒

1.  用于聚集值近似查询的基于密度的树索引结构  
   许俭 吴天轶 王晨 汪卫 施伯乐《计算机科学》,2005年第32卷第11期
   如何快速有效地对数据立方体上的聚集查询给出近似的回答,是数据挖掘和数据仓库研究领域中的核心问题之一。现有大多数聚集查询算法在同一个数据立方体上只能支持某种特定的而非多种类型的聚集查询。本文给出了一种新的框架AdenTS,即基于密度的自适应树结构,它可以回答同一数据立方体上的各类聚集查询,也提出了一些近似和启发式技术,改善了查询结果和精度。实验结果表明,这种方法在支持的查询种类和性能上是更好的。    

2.  缓存敏感的封闭冰山立方体计算  
   栾华  杜小勇  王珊《软件学报》,2010年第21卷第4期
   数据立方体计算通常会产生大量的输出结果,冰山立方体和封闭立方体是解决这个问题的比较流行的两种策略,二者可以结合使用.鉴于封闭冰山立方体(closed iceberg cube)的重要性和实用性,如何高效地计算封闭冰山立方体是一个值得研究的问题.提出一种缓存敏感(cache-conscious)的计算封闭冰山立方体的方法,在自底向上对数据进行聚集的同时,寻找覆盖聚集单元的封闭单元,将其输出,使用两种策略进行剪枝,去掉不必要的递归,同时使用Apriori剪枝技术,支持冰山立方体(iceberg cube)的计算.为了减少与内存相关的延迟,快速得到聚集结果,对多个维进行预排序,并将软件预取技术引入到数据扫描中.在模拟数据和真实数据上进行了详细而全面的实验研究,结果表明,封闭冰山立方体的计算方法是快速、有效的.    

3.  在PC集群上的封闭立方体计算  
   游进国  奚建清  张平健  刘艳霞《计算机科学》,2009年第36卷第6期
   封闭立方体是联机分析处理中一种有效的数据立方体压缩技术,但封闭立方体的并行算法目前很少有相关文献研究.提出了一种简单而实用的解决方案,即基于MapReduce计算框架,在非共享内存的PC集群上对封闭立方体进行分布式的预计算和查询.相关实验表明,本方法能快速处理千万级的数据,具有较好的线性加速比,而且能够更大地压缩数据立方体存储空间.    

4.  浓缩商覆盖立方体技术研究  
   陈富强  奚建清《计算机工程》,2011年第37卷第7期
   提出一种新的浓缩商覆盖立方体的数据立方体压缩技术,在商覆盖立方体中省略了部分只依据基本表即可快速应答查询的基本单元组,从而缩小其体积。给出浓缩商覆盖立方体的生成算法和查询算法。实验结果表明,浓缩商覆盖立方体的元组数量仅为原商覆盖立方体的62%,验证了浓缩商覆盖立方体技术的有效性。    

5.  一种基于关系数据库的脆弱性水印算法  
   杨大全  张立忠《数字社区&智能家居》,2007年第22期
   为了检测对关系数据库的恶意篡改,提出了一种脆弱性数字水印算法,该算法将数据库的元组划分到不同的分组中,在对分组内的所有元组进行秘密排序的基础上,生成由属性水印和元组水印构成的分组水印矩阵,从而可以将对数据库的篡改定位在分组范围内.理论分析和实验结果表明了该方法的有效性和可行性.    

6.  基于网络挖掘的实体关系元组自动获取  被引次数:1
   李维刚  刘挺  李生《电子学报》,2007年第35卷第11期
    二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组的方法.基准方法的平均准确率达到了78.12%,采用过滤措施后抽取方法的平均准确率达到了98.42%.实验结果表明,利用网络挖掘方法获取的实体关系元组能够很好满足信息抽取的应用,对抽取出的元组进一步处理,能够获取更多有价值的信息.    

7.  基于聚类的非一致性数据库聚集查询重写  
   谢东  杨路明  蒲保兴  刘波《小型微型计算机系统》,2008年第29卷第6期
   在聚类和非一致性数据库无聚集查询基础上提出聚集查询重写方法.通过聚集值范围限定了最值和期望值,给出无连接和有连接的聚集查询重写策略.聚集重写查询通过分析聚类中可能元组和分组属性来过滤聚类,计算初始分组属性的最值和期望值.实验使用TPC-H决策支持基准进行性能研究,分析了聚类基数和数据库尺寸等因素的影响.结果显示尽管重写查询显著地比初始查询的执行时间长,但还是可以接受的,表明方法是有效的.    

8.  Star Cube--一种高效的数据立方体实现方法  被引次数:3
   李盛恩  王珊《计算机研究与发展》,2004年第41卷第4期
   一个具有n个维的数据立方体有2^n个视图,视图越多,用于维护数据立方体的时间也就越长。通过将维分成划分维和非划分维,数据立方体可以转换成star cube.stal cube由一个综合表和那些仅包含划分维的视图组成。star cube使用前缀共享和元组共享技术不仅减少了所需的存储空间,还大大减少了计算和维护时间。在把一个分片限制在一个I/O单位的条件下,star cube的查询响应时间与数据立方体基本相同。实验结果也表明,star cube是一种在时空两方面均有效的数据立方体实现技术。    

9.  基于混合存储结构的数据立方体生成算法  
   李盛恩  徐进  张绍兰《计算机应用与软件》,2006年第23卷第1期
   通过把数据立方体中的维分为划分维和非划分维,视图中的数据被分成两部分,分别存储在关系和多维数组中。针对这种混合存储结构,我们设计了一个数据立方体生成算法,它结合了流水线聚集方法和多维数组聚集方法的优点,大大减少了流水线的条数和所需要的存储空间,加快了计算速度。并用一个实际数据集进行了实验,结果表明该算法适用于计算高维的数据立方体。    

10.  无须附加空间的数据立方体联机聚集  
   李红松  黄厚宽《软件学报》,2006年第17卷第4期
   以往在数据立方体上实现的联机聚集往往需要附加空间来存储联机聚集估算所需要的信息,极大地影响了数据立方体的存储和维护性能.提出了基于QC-Tree的用于范围查询处理的联机聚集PE(progressively estimate)算法以及它与简单聚集算法相结合的混合聚集算法HPE(hybrid progressively estimate);还提出了一种能够同时处理多个范围查询的联机聚集算法MPE(multiple progressively estimate).与以往联机聚集算法不同,这些算法不需要任何附加空间,而是利用QC-Tree自身保存的聚集数据和语义关系来估算聚集结果.由于QC-Tree是一种极为高效的数据立方体存储结构,因此能够以较理想的性能实现数据立方体上的联机聚集.对算法的分析和实验结果表明,所提出的算法具有较好的性能.    

11.  MESHJOIN*:实时数据仓库环境下的数据流更新算法  
   林子雨  林琛  冯少荣  张东站《计算机科学与探索》,2010年第4卷第10期
   提出了一种新的实时数据仓库环境下的数据流更新算法——MESHJOIN*算法。算法的特性有:(1)关系R采用了分块和散列的组织形式,尽可能避免对当前连接无效元组的读取,减少连接操作所涉及元组的数量,从而提高连接算法的效率;(2)采用了多线程并发连接技术,并根据工程学原理,实现了连接操作和关系R读取操作的最佳调度,保证了连接算法效率的最大化;(3)根据当前系统的服务率和数据流元组的到达率之间的关系,合理调度实时元组和准实时元组的执行,保证了系统对实时元组的处理要求。实验结果表明,MESHJOIN*算法可以取得比MESHJOIN算法更好的性能。    

12.  基于关联约束非二元弧一致性的约束满足问题求解  
   袁际军 单汨源 王克喜《计算机科学》,2008年第35卷第5期
   弧一致性算法在二元约束满足问题中取得了成功的应用,但并不能被有效泛化至预处理非二元约束满足问题(NCSP).本文提出了处理NCSP的关联约束非二元弧一致性算法.通过随机NCSP生成器产生问题实例,分别采用关联约束非二元弧一致性算法和非二元弧一致性算法进行预处理,并对预处理后的问题实例应用回溯算法进行求解.对比分析采用两种预处理算法和不采用预处理下回溯算法的求解性能,仿真实验结果表明关联约束非二元弧一致性算法可以有效地剔除冗余的约束元组和变量域值,使关联约束非二元弧一致性回溯算法具有更良好的鲁棒性.    

13.  一种生成封闭数据立方体的新算法  
   张亮  白振兴  周军  白云《弹箭与制导学报》,2010年第30卷第3期
   以武器装备故障维修数据为基础,研究了武器装备故障维修数据立方体,重点分析了封闭数据立方体与基本元组集之间的关系,提出一种建立武器装备故障维修封闭数据立方体模型的新算法,并针对冰山封闭数据立方体进行算法改进.最后利用近十年武器装备故障维修数据对算法进行验证,结果表明文中算法较之基本的封闭数据立方体算法具有更好的时空效率,为分析武器装备故障原因提供了一种更有效的手段.    

14.  集合上封闭立方体的计算  
   倪志伟  孟金华  毛雪岷《计算机工程与应用》,2011年第47卷第33期
   随着原始数据记录数的增多,数据立方体在存储空间和计算时间上的消耗都越来越大,封闭立方体是减少数据立方体的存储空间的有效手段。提出一种新的封闭数据立方体的生成算法,针对大量的原始数据集,通过预处理,采用类似BUC算法的计算顺序自上而下递归输出封闭单元,使用实际数据做了相关研究的实验,实验结果表明该算法能有效提高生成速度。    

15.  ROLAP环境下数据立方体的计算框架  
   李盛恩 张绍兰 巩建国《计算机科学》,2004年第31卷第10期
   数据立方体计算是联机分析中一项重要的技术。研完工作者提出了多种具有不同存储空间和查询相应时间的数据立方体,每种数据立方体有独自的生成算法。本文分析了使用关系系统作为存储结构的一般数据立方体、部分数据立方体和浓缩数据立方体的原理,提出用合作伙伴的概念统一这三类数据立方体的思想,并设计了一个算法TCUBE用于生成这些数据立方体。我们使用了一个实际数据集测试了TCUBE的性能,结果表明它生成浓缩数据立方体的速度要快于原有的算法。    

16.  数据仓库中聚集管理与导航策略  被引次数:4
   迟忠先  王红新  于凤友  李琛琛《小型微型计算机系统》,2002年第23卷第12期
   聚集是提高数据仓库系统性能的重要手段之一 ,本文在数据仓库和联机分析工具的研究和开发的实践中提出一种基于元组表示的聚集管理和导航策略 ,并在此基础上给出了聚集导航的优化算法 .该算法具有概念清晰 ,易于实现的优点    

17.  基于关系数据库的脆弱性水印算法研究  被引次数:1
   张立忠  姜楠  张洋《计算机工程与应用》,2008年第44卷第29期
   为了检测对关系数据库的恶意篡改,提出了一种脆弱性数字水印算法。该算法将数据库的元组划分到不同的分组中,在对每个分组内的元组进行秘密排序的基础上,生成由属性水印和元组水印构成的分组水印矩阵,因此可以将对数据库的篡改定位在分组范围内。利用单向哈希函数及关系数据动态生成水印,不但保证了水印信息的安全性,而且也实现了水印的盲检测。理论分析和实验结果表明,该方法能够有效探测攻击者对关系数据库进行元组添加、属性值修改、元组删除和属性变化四类操作,从而为关系数据的真实性认证提供依据。    

18.  基于Wikipedia的人名简历信息抽取  
   王全剑  李芳《计算机应用与软件》,2011年第28卷第7期
   实体关系抽取是目前信息抽取研究的热点.提出的简历信息抽取,就是从网页数据中抽取得到关于人的出身、学习教育、工作经历的三类不同关系元组(由两个实体和关系表示组成),从而整理出现实生活中人的简历信息.在基于句子分块(Chunk)和命名实体识别(NER)标记的抽取模式基础上,利用Wikipedia作为知识库,提出基于当前元组与关系表示集合语义相似度的关系判别算法对按照模式抽取得到的关系元组进行过滤和分类.实验结果表明抽取精度和F值对比基准方法上有了较大提高,并且实现了较高精度的简历信息类型分类.    

19.  不确定关系数据属性级溯源表示与概率计算  
   王梁  周光焱  王黎维  彭智勇《软件学报》,2014年第25卷第4期
   传统的数据库应用中,数据往往被假定是精确可用的,而实际中数据普遍存在不确定性.以往许多利用溯源信息追踪数据不确定性的方法往往关注元组或单一属性存在不确定性的情况,通过对元组添加唯一变量标识,用变量标识所表示的溯源信息构造布尔表达式计算结果元组概率.当元组中多个属性存在不确定性时,对元组进行标识不能帮助用户快速而准确地找到造成不确定性的源属性值.定义属性表达式,并通过属性表达式构造溯源表达式.利用该溯源表达式不仅可以准确地追溯不确定性产生的具体位置,同时还可以实现结果元组的概率计算.为保证概率计算结果的正确性,提出溯源表达式的转换算法.通过分析影响结果元组概率计算效率的因素,还提出构建共享路径表的方法,在构建过程中对原子析取式进行预计算,以提高概率计算的效率.实验部分将该方法与现有的元组级溯源信息表示方法在时间代价和空间代价方面进行比较,验证其可行性和有效性.此外,实验部分还对利用共享路径加快结果元组概率计算的有效性进行了评估.    

20.  基于维分类的关联规则的元规则制导挖掘  
   倪志伟  周之强  公维峰  孟金华《计算机工程与应用》,2011年第47卷第30期
   元规则制导的关联规则挖掘可以提高挖掘过程的效率和精确度,目前已经提出了许多关联规则的元规则制导挖掘算法,尤其是在关系数据库中;而在数据立方体上的元规则制导挖掘算法相对较少,且大多数是基于Apriori思想的算法,它们都存在冗余谓词搜索的问题。针对这种情况,提出了一种以元规则中维度的不同类型为依据的改进算法LRS,并在实验中证明了算法的有效性。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号