共查询到17条相似文献,搜索用时 46 毫秒
1.
钱颖 《小型微型计算机系统》2008,29(5):817-824
模式匹配是数据集成和数据转换中的重要问题.现有的模式匹配方法大多集中于发掘模式间的1:1匹配,然而,现实世界模式之间除了1:1匹配还包括许多的复杂匹配.本文提出一种新的发掘数据库模式问复杂匹配的方法--CSM(Complex Schema Matching),它在全面发掘模式问1:1和复杂匹配的同时,还可进一步找到不透明列间的匹配关系.实验表明,CSM不仅能全面的发掘模式间匹配,与其它模式匹配方法相比,还具有较高的查全率、查准率和效率. 相似文献
2.
3.
模式匹配是模式集成、语义WEB及电子商务等领域的重点及难点问题. 为了有效利用专家知识提高匹配质量, 提出了一种基于部分已验证匹配关系的模式匹配模型. 在该模型中, 首先,人工验证待匹配模式元素间的少量对应关系, 进而推理出当前任务下部分已知的匹配关系及单独匹配器的缺省权重; 然后,基于上述已收集到的先验知识对多种匹配器所生成的相似度矩阵进行合并及调整, 并在全局范围内进行优化; 最后,对优化矩阵的选择性进行评估, 从而为不同匹配任务推荐最合理的候选匹配生成方案. 实验结果表明, 部分已验证匹配关系的使用有助于模式匹配质量的提高. 相似文献
4.
伴随大数据时代的到来,数据快速保序匹配与检索成为众多大数据应用急需解决的关键问题,通过抽象与归约等措施,数据对象可抽象为具有若干属性的点集或序列,从而将数据匹配问题转化为字符或数字序列匹配问题。提出一种基于相似度过滤的数据保序匹配与检索算法,算法分三步:(1)数据转换,基于幅值变化趋势将原始序列转换为二进制,对序列中任何一个字符,通过判断包括其前后邻居在内的三个点的关系定义二进制序列,准确反映相邻三点之间的凸增长(降低)或凹增长(降低)关系;(2)数据归约,为方便候选序列与模式序列之间的相似度计算,运用基于幅度变化比例的数据归约方法,将候选序列与模式序列均归约到固定区间;(3)相似度计算,为区分不同趋势的凸增长(降低)或凹增长(降低)幅度,通过计算候选序列与模式序列对应点之间的差值绝对值之和作为相似度判断依据,提出基于相似度过滤的快速匹配方法,寻找与模式序列变化趋势一致的子序列集合,并按照相似度大小排序。理论分析与实验结果表明:(1)该算法具有亚线性时间复杂度;(2)该算法能有效解决Chhabra等人算法对数据震荡幅度失控的问题,同时解决数据序列与模式序列分段规律但整体不相似的问题;(3)解决了Chhabra等人算法中对匹配序列排序造成的匹配结果疏漏问题。该方法不仅能更准确、更多地匹配出变化趋势一致的子字符串,同时将多个候选子串根据与模式之间的相似度进行排序,为进一步的数据精确检索提供判断依据。 相似文献
5.
6.
模式间的语义匹配是实现数据共享和交换的基础和关键。介绍了一种用于完成异构数据源复杂语义匹配的半自动化匹配系统iSeMatch。其多匹配器架构保证了匹配的效率,同时使系统具有高度可扩展性;而包括领域约束、匹配历史和领域本体模型在内的领域知识的利用,更进一步提高了匹配结果的准确率。该系统是半自动化生成语义匹配并尽可能减少人工干预的一种有效的解决方案。 相似文献
7.
8.
一种基于模板匹配的手形认证算法 总被引:5,自引:0,他引:5
身份认证是保证信息与网络安全的一种重要手段,手形认证是身份认证的重要方法之一。传统手形识别方法大致分成特征矢量匹配和点模式匹配两种:前者通过计算手形的长度和宽度等特征矢量来对不同手形进行匹配认证,该方法计算量小,但是误识率偏高;后者通过将手形轮廓图象表示为一系列特征点集,然后对两个手形的特征点集进行匹配认证,误识率较小,但计算量和拒识率相对较大。以上原因导致了两种算法都不能被广泛应用。该文提出了一种基于模板的点匹配算法,可以较好地解决点模式匹配计算量过大的问题,同时也能够提高认证识别率。在认证过程中还采用了方向角及膨胀收缩修正等方法,使得模板的匹配速度和拒识率得到有效的改善,从而大大增强了认证过程的鲁棒性。 相似文献
9.
本文给出了一种新的基于模式树构造的多模式并行匹配算法,算法高效简单且实现了匹配的并行化,特别适合于信息检索,摸式识别,入侵检测等的方面的多关键字查找。对比分析表明,新算法有较大的移动步长,能够有效减少了实际匹配的规模,使时间和资源消耗均得到了降低,提高了查找速度。 相似文献
10.
11.
关系数据库模式和本体间映射的研究综述 总被引:3,自引:1,他引:3
关系数据库模式和本体问映射是语义网研究中的一个重要问题.首先,给出关系数据库模式和本体间映射的形式化定义,并从建模思想和应用场景两个方面分析问题的难点.根据3个不同角度,即模型转换的途径、映射策略的适用范围以及映射结果的表达形式,调研当前存在的多种解决途径.在此基础上,进一步介绍并比较6个具有代表性的关系数据库模式和本体间映射的工具.最后,讨论存在的挑战,并指出未来可能的研究方向. 相似文献
12.
借助于 Web,异地分布的异构关系数据进行融合与交互成为可能 ,提出具有不同模式描述的关系数据自动地进行融合和交互的第一步是对关系模式进行基于语义信息的等价性评价这一概念 ;提出关系模式等价的定义、及其具有自反性、传递性和对称性的性质 ;提出关系模式描述文件这一元数据的定义和生成规则、并给出其 DTD;最后给出并实现了算法 相似文献
13.
The problem of integrating data from multiple data sources—either on the Internet or within enterprises—has received much attention in the database and AI communities. The focus has been on building data integration systems that provide a uniform query interface to the sources. A key bottleneck in building such systems has been the laborious manual construction of semantic mappings between the query interface and the source schemas. Examples of mappings are element location maps to address and price maps to listed-price. We propose a multistrategy learning approach to automatically find such mappings. The approach applies multiple learner modules, where each module exploits a different type of information either in the schemas of the sources or in their data, then combines the predictions of the modules using a meta-learner. Learner modules employ a variety of techniques, ranging from Naive Bayes and nearest-neighbor classification to entity recognition and information retrieval. We describe the LSD system, which employs this approach to find semantic mappings. To further improve matching accuracy, LSD exploits domain integrity constraints, user feedback, and nested structures in XML data. We test LSD experimentally on several real-world domains. The experiments validate the utility of multistrategy learning for data integration and show that LSD proposes semantic mappings with a high degree of accuracy. 相似文献
14.
关系模式到XML模式的转换研究 总被引:5,自引:1,他引:5
本文首先研究了关系模式的特点,然后针对XML的树型结构特点,研究了基于语义约束的从关系模式到XML模式的转换,最后给出了从关系模式到XML模式转换的算法RTS。 相似文献
15.
随着在线数据库应用的流行,整个互联网已经被迅速"深化".对于某一特定领域的deep Web,不同的站点往往会提供不同查询能力的查询接口.为了能够集成同一领域内的各个数据源,首先要解决的问题就是查询接口的集成.但是面对数量众多和结构各异的查询接口,基于人工或规则的集成方案显然无法适用.针对这种状况,提出了基于树合并的查询接口全自动集成方法.树结构可以充分体现查询接口属性之间的结构关系,通过树的合并来实现查询接口的集成.该方法不但能保持各个原始接口的结构特征,还具备良好的扩展性,以适应不断频繁更新的查询接口.最后通过多个领域的测试数据证明了本方法的有效性. 相似文献
16.
17.
基于函数依赖的结构匹配方法 总被引:2,自引:0,他引:2
模式匹配是模式集成、数据仓库、电子商务以及语义查询等领域中的一个基础问题,近来已经成为研究的热点,并取得了丰硕的成果.这些成果主要利用元素(典型的为关系模式中的属性)自身的信息来挖掘元素语义,目前,这方面的研究已经相当成熟.结构信息作为模式中一种重要的信息,能够为提高模式匹配的精确性提供有用的支持,但是目前关于如何利用结构信息提高模式匹配的精确性的研究还很少.将模式元素之间的相似度分为语义相似度(根据元素自身信息得到的相似度)和结构相似度(根据元素之间的关联关系得到的相似度),并采用新的统计方法计算元素间的结构相似度,然后再综合考虑语义相似度得到元素间的相似概率;最后根据相似概率得到模式元素间的映射关系(模式元素之间的对应关系).实验结果表明,该算法在查准率、查全率及全面性等方面都优于已有的其他算法. 相似文献