首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
模式匹配是数据集成和数据转换中的重要问题.现有的模式匹配方法大多集中于发掘模式间的1:1匹配,然而,现实世界模式之间除了1:1匹配还包括许多的复杂匹配.本文提出一种新的发掘数据库模式问复杂匹配的方法--CSM(Complex Schema Matching),它在全面发掘模式问1:1和复杂匹配的同时,还可进一步找到不透明列间的匹配关系.实验表明,CSM不仅能全面的发掘模式间匹配,与其它模式匹配方法相比,还具有较高的查全率、查准率和效率.  相似文献   

2.
提出了一种基于相似度传播的复杂网络间节点匹配方法.引入节点相似度传播过程,使得初始的相似度信息能够按网络拓扑结构传播到全局,从而能够充分利用有限数目已匹配节点对所提供的相似度信息.该传播过程的稳态分布与一个大矩阵的主特征向量等价,可采用幂方法的迭代形式来高效求解,最后利用图论中的KM(Kuhn-Munkres)算法来抽取最终的匹配节点对.以四种不同结构的网络节点匹配实验为例,对本文算法进行了测试和验证.实验统计结果表明,本文方法显著提高了节点匹配的精度.  相似文献   

3.
模式匹配是模式集成、语义WEB及电子商务等领域的重点及难点问题. 为了有效利用专家知识提高匹配质量, 提出了一种基于部分已验证匹配关系的模式匹配模型. 在该模型中, 首先,人工验证待匹配模式元素间的少量对应关系, 进而推理出当前任务下部分已知的匹配关系及单独匹配器的缺省权重; 然后,基于上述已收集到的先验知识对多种匹配器所生成的相似度矩阵进行合并及调整, 并在全局范围内进行优化; 最后,对优化矩阵的选择性进行评估, 从而为不同匹配任务推荐最合理的候选匹配生成方案. 实验结果表明, 部分已验证匹配关系的使用有助于模式匹配质量的提高.  相似文献   

4.
伴随大数据时代的到来,数据快速保序匹配与检索成为众多大数据应用急需解决的关键问题,通过抽象与归约等措施,数据对象可抽象为具有若干属性的点集或序列,从而将数据匹配问题转化为字符或数字序列匹配问题。提出一种基于相似度过滤的数据保序匹配与检索算法,算法分三步:(1)数据转换,基于幅值变化趋势将原始序列转换为二进制,对序列中任何一个字符,通过判断包括其前后邻居在内的三个点的关系定义二进制序列,准确反映相邻三点之间的凸增长(降低)或凹增长(降低)关系;(2)数据归约,为方便候选序列与模式序列之间的相似度计算,运用基于幅度变化比例的数据归约方法,将候选序列与模式序列均归约到固定区间;(3)相似度计算,为区分不同趋势的凸增长(降低)或凹增长(降低)幅度,通过计算候选序列与模式序列对应点之间的差值绝对值之和作为相似度判断依据,提出基于相似度过滤的快速匹配方法,寻找与模式序列变化趋势一致的子序列集合,并按照相似度大小排序。理论分析与实验结果表明:(1)该算法具有亚线性时间复杂度;(2)该算法能有效解决Chhabra等人算法对数据震荡幅度失控的问题,同时解决数据序列与模式序列分段规律但整体不相似的问题;(3)解决了Chhabra等人算法中对匹配序列排序造成的匹配结果疏漏问题。该方法不仅能更准确、更多地匹配出变化趋势一致的子字符串,同时将多个候选子串根据与模式之间的相似度进行排序,为进一步的数据精确检索提供判断依据。  相似文献   

5.
在Java蓝图开发时,挖掘出一些常用的过程模式、算法模式等,这些模式可能在开发中会经常用到,所以,将发掘出来的模式存储到模型库中。在用Java蓝图进行建模时,对未知的模型与模型库中的已有模式进行匹配,若匹配成功,则用已有模式替换模型中的匹配部分,可以达到简化模型的效果。Java蓝图的模式匹配包含结构匹配、参数匹配、语义匹配三部分。结构匹配是参数匹配和语义匹配的前提和基础,本文主要研究基于Java蓝图模式的结构匹配。  相似文献   

6.
模式间的语义匹配是实现数据共享和交换的基础和关键。介绍了一种用于完成异构数据源复杂语义匹配的半自动化匹配系统iSeMatch。其多匹配器架构保证了匹配的效率,同时使系统具有高度可扩展性;而包括领域约束、匹配历史和领域本体模型在内的领域知识的利用,更进一步提高了匹配结果的准确率。该系统是半自动化生成语义匹配并尽可能减少人工干预的一种有效的解决方案。  相似文献   

7.
复杂网络间节点匹配在很多领域中均具有重要现实意义。然而,传统的节点匹配算法通常只利用网络的局部拓扑信息,在对拥有高对称性的真实网络作用时往往会失效。为了克服这一缺点,我们近期利用网络拓扑信息和连边权重信息,提出了一种新型的同时来计算不同网络间节点相似度的方法,并在此基础上设计了一种加权迭代节点匹配算法。将该算法在高度拓扑对称仿真网络对和真实中英文语言网络对上分别进行了测试,结果表明加权迭代节点匹配算法在此类网络上优于纯拓扑迭代节点匹配算法。  相似文献   

8.
一种基于模板匹配的手形认证算法   总被引:5,自引:0,他引:5  
身份认证是保证信息与网络安全的一种重要手段,手形认证是身份认证的重要方法之一。传统手形识别方法大致分成特征矢量匹配和点模式匹配两种:前者通过计算手形的长度和宽度等特征矢量来对不同手形进行匹配认证,该方法计算量小,但是误识率偏高;后者通过将手形轮廓图象表示为一系列特征点集,然后对两个手形的特征点集进行匹配认证,误识率较小,但计算量和拒识率相对较大。以上原因导致了两种算法都不能被广泛应用。该文提出了一种基于模板的点匹配算法,可以较好地解决点模式匹配计算量过大的问题,同时也能够提高认证识别率。在认证过程中还采用了方向角及膨胀收缩修正等方法,使得模板的匹配速度和拒识率得到有效的改善,从而大大增强了认证过程的鲁棒性。  相似文献   

9.
本文给出了一种新的基于模式树构造的多模式并行匹配算法,算法高效简单且实现了匹配的并行化,特别适合于信息检索,摸式识别,入侵检测等的方面的多关键字查找。对比分析表明,新算法有较大的移动步长,能够有效减少了实际匹配的规模,使时间和资源消耗均得到了降低,提高了查找速度。  相似文献   

10.
概念匹配方法综述*   总被引:1,自引:0,他引:1  
陈千  向阳  魏韡 《计算机应用研究》2010,27(4):1201-1206
详细介绍了概念匹配方法研究的背景和意义,分析和比较了现有的概念匹配方法及其优缺点和应用,并展望了概念匹配方法发展的方向。  相似文献   

11.
关系数据库模式和本体间映射的研究综述   总被引:3,自引:1,他引:3  
关系数据库模式和本体问映射是语义网研究中的一个重要问题.首先,给出关系数据库模式和本体间映射的形式化定义,并从建模思想和应用场景两个方面分析问题的难点.根据3个不同角度,即模型转换的途径、映射策略的适用范围以及映射结果的表达形式,调研当前存在的多种解决途径.在此基础上,进一步介绍并比较6个具有代表性的关系数据库模式和本体间映射的工具.最后,讨论存在的挑战,并指出未来可能的研究方向.  相似文献   

12.
借助于 Web,异地分布的异构关系数据进行融合与交互成为可能 ,提出具有不同模式描述的关系数据自动地进行融合和交互的第一步是对关系模式进行基于语义信息的等价性评价这一概念 ;提出关系模式等价的定义、及其具有自反性、传递性和对称性的性质 ;提出关系模式描述文件这一元数据的定义和生成规则、并给出其 DTD;最后给出并实现了算法  相似文献   

13.
Learning to Match the Schemas of Data Sources: A Multistrategy Approach   总被引:5,自引:0,他引:5  
Doan  AnHai  Domingos  Pedro  Halevy  Alon 《Machine Learning》2003,50(3):279-301
The problem of integrating data from multiple data sources—either on the Internet or within enterprises—has received much attention in the database and AI communities. The focus has been on building data integration systems that provide a uniform query interface to the sources. A key bottleneck in building such systems has been the laborious manual construction of semantic mappings between the query interface and the source schemas. Examples of mappings are element location maps to address and price maps to listed-price. We propose a multistrategy learning approach to automatically find such mappings. The approach applies multiple learner modules, where each module exploits a different type of information either in the schemas of the sources or in their data, then combines the predictions of the modules using a meta-learner. Learner modules employ a variety of techniques, ranging from Naive Bayes and nearest-neighbor classification to entity recognition and information retrieval. We describe the LSD system, which employs this approach to find semantic mappings. To further improve matching accuracy, LSD exploits domain integrity constraints, user feedback, and nested structures in XML data. We test LSD experimentally on several real-world domains. The experiments validate the utility of multistrategy learning for data integration and show that LSD proposes semantic mappings with a high degree of accuracy.  相似文献   

14.
关系模式到XML模式的转换研究   总被引:5,自引:1,他引:5  
本文首先研究了关系模式的特点,然后针对XML的树型结构特点,研究了基于语义约束的从关系模式到XML模式的转换,最后给出了从关系模式到XML模式转换的算法RTS。  相似文献   

15.
随着在线数据库应用的流行,整个互联网已经被迅速"深化".对于某一特定领域的deep Web,不同的站点往往会提供不同查询能力的查询接口.为了能够集成同一领域内的各个数据源,首先要解决的问题就是查询接口的集成.但是面对数量众多和结构各异的查询接口,基于人工或规则的集成方案显然无法适用.针对这种状况,提出了基于树合并的查询接口全自动集成方法.树结构可以充分体现查询接口属性之间的结构关系,通过树的合并来实现查询接口的集成.该方法不但能保持各个原始接口的结构特征,还具备良好的扩展性,以适应不断频繁更新的查询接口.最后通过多个领域的测试数据证明了本方法的有效性.  相似文献   

16.
通过分析在实际工作流中易出现的复杂模式,探究了以往文献中的重构算法不能处理这些模式的原因.通过对算法进行修正,使该算法能够对复杂模式进行有效处理.通过实验证明,改进后的算法仍能保持良好的性能,适用性较强.  相似文献   

17.
基于函数依赖的结构匹配方法   总被引:2,自引:0,他引:2  
李国徽  杜小坤  胡方晓  杨兵  唐向红 《软件学报》2009,20(10):2667-2678
模式匹配是模式集成、数据仓库、电子商务以及语义查询等领域中的一个基础问题,近来已经成为研究的热点,并取得了丰硕的成果.这些成果主要利用元素(典型的为关系模式中的属性)自身的信息来挖掘元素语义,目前,这方面的研究已经相当成熟.结构信息作为模式中一种重要的信息,能够为提高模式匹配的精确性提供有用的支持,但是目前关于如何利用结构信息提高模式匹配的精确性的研究还很少.将模式元素之间的相似度分为语义相似度(根据元素自身信息得到的相似度)和结构相似度(根据元素之间的关联关系得到的相似度),并采用新的统计方法计算元素间的结构相似度,然后再综合考虑语义相似度得到元素间的相似概率;最后根据相似概率得到模式元素间的映射关系(模式元素之间的对应关系).实验结果表明,该算法在查准率、查全率及全面性等方面都优于已有的其他算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号