首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
数据依赖是数据库的一个重要概念。函数依赖是一种常见的数据依赖关系,是数据语义的重要组成部分。随着XML文档的大量出现,这一概念被引入到XML的领域中。本文在约束限制范围的基础上,给出了XML函数依赖的定义。引入粗糙集解决XML数据不完整的特点,给出XML函数依赖的判定定理。并且提出了一个发现XML文档中最小非平凡函数依赖的算法。该算法基于一致集的概念,通过不可分辨关系划分元组集减少求一致集的运算次数,使用逐层求精的算法来计算最小非平凡XML函数依赖集的左部。通过该算法得到的XML函数依赖的语义信息对数据存储模式设计、查询优化和更新异常检查来说是十分重要的。  相似文献   

2.
王欢  张云峰  张艳 《计算机科学》2018,45(3):311-316
数据一致性是大数据质量管理研究的一个重要内容。条件函数依赖(CFDs)是维护数据一致性的有效技术手段。然而,在修复过程中选择不同的CFDs修复顺序,会影响修复的准确性和效率。因此,如何选取一个正确且合理的修复顺序对数据修复至关重要。针对该问题,提出一种基于CFDs规则的快速判定修复序列的计算方法。首先,设计了一种数据修复框架。然后,利用CFDs之间的关联关系,提出了修复序列图的概念, 以用于CFDs修复顺序的计算。一方面,可以避免某些错误的或者不必要的数据修复,提高修复的准确性。另一方面,使用规则来判定修复顺序比使用实际数据进行判定更为快速。此外,在判定修复序列的过程中,对修复死锁进行了检测,保证了修复过程的可终止性。最后,通过在真实数据集上与现有方法进行对比实验,证明了所提方法具有更高的准确性和运行效率。  相似文献   

3.
条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时重新定义条件函数依赖,改进发现条件函数依赖的算法(即CTANE算法);以水库工程数据为例,验证本文改进的算法能准确高效地发现水利普查数据中的条件函数依赖,为检测数据一致性做好准备。  相似文献   

4.
构件和服务等软件实体的动态更新是支撑软件系统在线演化的关键技术,该技术可以在不中断系统运行的前提下对软件系统的结构或行为进行调整。然而,为保证更新前后系统行为的一致性,只有当软件实体处于安全状态时方可进行更新。以基于WS-BPEL(Web Service Business Process Execution Language)的软件系统为例,通过分析WS-BPEL过程与其成员服务间的依赖关系,提出了一种可预判成员服务是否动态更新的算法。实验结果表明,依赖分析算法可以有效预判成员服务可动态更新的时机,从而在不影响系统行为一致性的前提下有效减少动态更新所引起的服务中断。  相似文献   

5.
李卫榜  李战怀  陈群  杨婧颖  姜涛 《软件学报》2016,27(8):2068-2085
关系数据库中可能存在数据不一致性现象,关系数据库数据质量的一个主要问题是存在违反函数依赖情况.为找出不一致数据,需要进行函数依赖冲突检测.集中式数据库中可以通过SQL技术检测不一致情况,尽管检测效率不高;而分布式环境下不一致性检测更富有挑战性,不仅需要考虑数据的迁移,检测任务如何分配也是一个难题.在大数据背景下,上述问题更加突出.提出了一种分布式环境单函数依赖不一致性检测方法,给出了不一致性检测响应时间代价模型.为减少数据迁移量和响应时间,基于等价类对待检测数据进行预处理.由于分布式环境不一致性检测问题为NP-hard问题,多项式时间内难以得到最优解,给出了代价模型的多项式时间3/2-近似最优解.提出了一种分布式环境多函数依赖不一致性检测方法,基于最小集合覆盖理论,通过一次数据遍历,对多个函数依赖进行并行批检测,同时考虑检测过程中的负载均衡等问题.在真实和人工数据集上的实验表明:相对于传统的检测方法以及基于Hadoop的Naïve方法,所提出的检测方法检测效率有明显的提升,且扩展性能良好.  相似文献   

6.
针对高校实际数据质量检测过程中数据集存在缺失值以及发现的函数依赖个数较少且不准确的问题,提出了一种结合近邻传播(AP)聚类算法和TANE算法的高校函数依赖发现方法(APTANE)。首先,对数据集中的中文字段进行列剖析,将中文字段值用对应的数值来表示;其次,使用AP聚类算法对数据集中的缺失值进行填补;最后,使用TANE算法从处理好的数据集中自动发现出满足非平凡、最小要求的函数依赖。实验结果表明,在使用AP聚类算法对真实的高校数据集进行修复之后,相比于直接使用函数依赖自动发现算法,发现的函数依赖个数增加到了80个,经过缺失值填补后所发现的函数依赖在表示字段间关联关系时也更加准确,减少了领域专家的工作量,提升了高校数据所拥有数据的质量。  相似文献   

7.
代码克隆检测是软件工程中的基础研究,在软件分析和维护方面有着广泛应用。目前对于有文本差异的高级别(即学术界定义的级别3和级别4)克隆检测,现有方法存在检出率(回收率)不高的问题。基于程序依赖图PDG的检测方法是高级别克隆检测的一类重要方法,但这类方法依赖子图同构的精确图匹配算法,算法时间复杂度高且回收率较低。为此,提出了一种新的高级别代码克隆检测方法,使用基于 Weisfeiler-Lehman图核的非精确图匹配算法进行代码克隆检测。实验结果表明,与已有的代码克隆检测方法相比, 该方法可以检出更多的高级别克隆且计算时间较短。  相似文献   

8.
当前用于时空图挖掘的算法通常基于专家预定义或者经过特征增强的静态图结构,这些静态的图结构往往依赖于主观先验知识构建,并且不包含时间动态性的变化。为完成自动获取时空图数据中动态图特征的任务,提出一种基于时空稀疏注意力的时空图挖掘算法(STSAN)。构造空间稀疏注意力层,通过对每个时间片上节点间的关系进行度量生成稀疏图,并在各个稀疏图结构上使用注意力机制完成节点空间(纵向)特征的提取。时间稀疏注意力层通过类似的方式完成节点时序(横向)特征的提取。在此基础上,将空间稀疏注意力层和时间稀疏注意力层堆叠为时空稀疏Transformer模块,完成时空依赖关系建模。实验结果表明,与DCRNN、STGCN等方法相比,该算法在2个公开的交通数据集上能够获得2.65%~16.35%的性能提升,将所提出的空间稀疏注意力层直接用于替换现有算法的空间特征模块,能够在原算法基础上获得平均3.18%~9.14%的性能提升。  相似文献   

9.
时态类型集的封闭集   总被引:5,自引:0,他引:5  
好的数据库逻辑设计目标是消除数据冗余以及插入和删除异常。对于时态数据库,可以利用具有多时间粒度的时态函数依赖(TFDs)约束对时态数据库进行规范化。要进行有效的数据库设计,需要解决有限属性闭包和成员籍等一些有关TFD的问题。为了方便计算机对时态类型的处理和找到有效的解决TFD的相关问题的算法,该文提出了封闭时态类型集的概念,并且给出了一个求给定TFD集的封闭集的算法。  相似文献   

10.
在许多大型信息系统中需要存储大量的历史数据.为了有效地组织这些时间变化数据,可以使用时态函数依赖(TFDs)对时态数据库进行有效地设计.由于多时间粒度的使用,数据库设计算法需要在计算机上实现表示时态类型间的关系的逻辑结构和时态类型间的相关操作.为此提出了细于关系矩阵和封闭的时态类型集,并且对于给定的时态类型集及其细于关系矩阵,给出了一个自动生成它的一个封闭集及封闭集对应的细于关系矩阵的有效算法,通过提出的细于关系矩阵和封闭集算法,可以方便地在计算机上实现时态数据库设计算法需要的时态类型间的细于关系比较和glb操作。  相似文献   

11.
条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检测规则进行了改进。改进后的检测方法在基于多个函数依赖的检测中显示出了优越性,使得检测工作更为精简,检测标准更加明确。  相似文献   

12.
模式匹配问题指的是搜索所有同构于模式图的数据子图,它是一种典型的子图同构问题。多模式匹配问题是对模式匹配问题的一个扩展,其主要的挑战是多个模式图之间的并发执行策略。为了应对这个挑战,提出一种面向RDF图的模式匹配方法(M-PM)。通过计算多个模式图之间的公共查询子图,根据查询子图、模式图的包含关系构建依赖树;提出节点分片表的概念,用来扩展依赖树中单一的包含关系;设计了一种快速的多模式匹配算法,其通过对数据图的一次遍历便可以求得多个模式图的匹配子图。实验结果表明,M-PM方法比一般方法提高了约70%执行时间效率。在处理相同规模的模式图的情况下,M-PM方法执行效率只与残差边个数有关,残差边越少执行效率越高。  相似文献   

13.
条件函数依赖(Conditional Functional Dependeny,CFD)是对函数依赖(Functional Depencency,FD)加入语义约束扩展而来,它在数据库一致性检测、数据清洗方面更优于后者.讨论了条件函数依赖的相关概念及其基本性质,讨论如何将它应用于数据清洗,并对已提出的基于CFD的数据清洗方案提出改进措施,并通过实验说明改进措施的可行性.  相似文献   

14.
为解决连通支配集的最小化问题,提出基于改进的分布式学习自动机的近似算法,在分布式学习自动机按随机选择进行深度搜索的基础上考虑回溯策略。该算法构造的是网络中的一棵支配树,只需要节点的局部信息。在网络建模图——单位圆盘图上对支配树性质进行分析和模拟实验。实验结果表明,与现有算法相比,该算法能得到更优的最小连通支配集。  相似文献   

15.
为了提高网络入侵检测的正确率,提出一种改进蚁群优化算法(ACO)和支持向量机(SVM)相融合的网络入侵检测方法(ACO-SVM)。将SVM模型参数作为蚂蚁的位置向量,采用动态随机抽取的方法来确定目标个体引导蚁群进行全局搜索,同时在最优蚂蚁邻域内进行小步长局部搜索,找到SVM最优参数,采用最优参数建立网络入侵检测模型。利用KDDCUP99数据集对ACO-SVM性能进行测试,结果表明,ACO-SVM提高了网络入侵检测正确率,降低了误报率,可以为网络安全提供有效保证。  相似文献   

16.
17.
基于经验模态分解和递归图的语音端点检测算法   总被引:1,自引:1,他引:0       下载免费PDF全文
结合Hilbert-Huang变换中的经验模态分解(EMD)和递归图(RP)法,提出了一种新的语音端点检测算法。该算法首先基于语音和噪声通过经验模态分解及其多尺度特征,在不同的固有模态函数(IMF)上进行软阈值时间尺度滤波处理,然后采用非线性动力学行为中的递归图法,定量统计递归分析中的确定性进行语音端点检测。仿真结果表明,该方法具有很强的非稳态动态变化分析能力,在低信噪比环境下较传统方法能更准确提取出语音信号的起止点,鲁棒性好。  相似文献   

18.
高维廷  李辉  翟海天 《计算机工程》2011,37(12):104-106
对强多址干扰情况下码分多址系统的盲多用户检测算法进行研究,针对多径信道的码分多址系统,提出一种基于自适应卡尔曼滤波的盲多用户检测算法。该算法可在进行状态滤波的同时对未知噪声的统计特性进行在线估计,确保算法收敛于期望用户,提高检测器在动态环境下的跟踪性能。仿真结果表明,与最小均方算法及递推最小二乘算法相比,该算法具有更好的收敛性和动态性能。  相似文献   

19.
针对直接递归最小二乘(RLS)算法存在的检测数值不稳定和收敛速度较慢等问题,将约束最小输出能量(CMOE)准则与直接RLS算法结合,提出一种基于CMOE准则的盲自适应RLS多用户检测算法。将该算法与直接RLS算法进行动、静态环境下输出信干比(SIR)、剩余输出能量(EOE)和误码率(BER)等方面的仿真,对比得出该算法具有更好的动态跟踪能力,更快的收敛速度和更高的稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号