首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
为了能够有效度量模式匹配的不确定性,提出了一个模式匹配不确定性的度量模型,根据不确定性因素间的关系提出了一个集结算子。使用全知熵度量语义匹配和属性匹配的不确定性,引入过程不确定性的度量方法度量匹配决策过程的不确定性。使用多因素集结算子判断各因素的影响程度,并可合成各度量结果。实验证明,所提模型和方法能够有效度量模式匹配的不确定性,且具有高效性和可扩展性。  相似文献   

2.
模式匹配是数据管理中的一个基础性问题。随着数据集的不断增长,使用自动化模式匹配工具能大大节省匹配时间,但其给出的结果带有不确定性,且难以消除。提出了一种用于模式匹配众包方法中的问题发布策略“Entropy-Beta”。该方法在发包阶段,对发包流程进行了优化,用于提高解决模式匹配不确定性问题
  的效率。在此基础上提供了对众包工作者答案精度评估的方法,用于提高解决模式匹配不确定性问题的精确度。最后通过实验证明,“Entropy-Beta”问题发包策略更加高效,并且在有限的成本下,运用该发包策略能提高解决问题的精确度。  相似文献   

3.
Deep Web集成服务的不确定模式匹配   总被引:5,自引:0,他引:5  
随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模式之间以及集成查询接口模式与Web数据库查询接口模式之间的匹配关系,是Deep Web集成服务中进行合理的用户请求转换的关键.之前的相关工作都是寻找最佳的匹配结果,回避匹配的不确定性,丢弃了可能有价值的其他匹配结果.文中首先剖析了请求转换中模式匹配的不确定性,提出了数字类型的相似度计算方法,给出了进行数字类型的模式匹配的有效的剪枝方法以及数据类型驱动的模式匹配优化方法,并在此基础上提出了一种基于相似度计算的不确定性模式匹配方法,最后通过大量的实验证明了该方法的有效性.  相似文献   

4.
胡文彬  李千目  张宏 《计算机应用》2010,30(10):2592-2594
针对已有模式匹配中证据组合方法效率较低的缺点,提出一个能够处理不确定性模式匹配的模型——USMM(Uncertain Schema Matching Model)。该模型是多维混合模型,其中运用领域知识和证据组合方法处理模式匹配中的不确定性,以降低匹配复杂度;利用模式的多维结构信息挖掘匹配中内在的不确定性;在计算名称相似度的公式中加入可信度来细化匹配的不确定度。最后形式化定义了不确定模式匹配、不确定匹配关系。实例分析证明该模型是可行的,具有较高的实用价值。  相似文献   

5.
论文对国内外关于模式匹配的研究进行综合分析,主要从模式匹配的角度对复杂模式匹配过程进行了研究,并着重对结构化的模式匹配进行了研究,对结构相似度和语言相似度进行综合;在语言匹配的基础上,对结构匹配进行分类匹配,采用自顶向下分别从非叶子节点和叶子节点进行模式匹配,非叶子节点匹配结果对叶子节点匹配结果有传递指导作用.该方法是一种利用元素间的结构信息来辅助模式匹配的新方法.最终达到提高模式匹配结果准确率的目的.  相似文献   

6.
图编辑距离是图模式匹配技术中常用的方法之一。基于图编辑距离的匹配方法能够处理多种类型的图数据,因而受到了学术界的广泛关注。首先介绍了图编辑距离的相关概念;然后简述了基于启发式搜索技术的精确图编辑距离算法,重点分析了基于二分图匹配的近似图编辑距离算法;最后对现存的一些图编辑问题进行了总结,并对未来的发展趋势进行了展望。  相似文献   

7.
GML是基于XML的空间信息编码标准。GML模式匹配技术作为实现应用模式的集成与共享的关键技术,与GML解析机理和实现技术密切相关。本文详细介绍了关于GML模式匹配的概念;给出了匹配方法的步骤、算法及已所实现的模式匹配详细流程,包括语意与结构相似度判断以及权重的设置;最后,对匹配过程中包含的不确定因素进行了分析与讨论。  相似文献   

8.
模式匹配方法研究   总被引:3,自引:0,他引:3  
从模式匹配的定义开始介绍,对已有的模式匹配方法进行分类,探讨了这些方法适用的领域和所能发掘的信息,区分了实例级和模式级、元素级和结构级以及基于自然语言和基于约束的匹配程序,以期在比较不同模式匹配方法或研究新匹配算法以及实现模式匹配组件时有所帮助。  相似文献   

9.
规则软件系统模式匹配算法研究综述   总被引:1,自引:0,他引:1  
模式匹配算法是规则软件系统的核心技术.本文叙述规则软件系统的基本概念、工作原理和主要推理方式;研究规则软件系统的模式匹配问题,总结了改善模式匹配效率的方法和技术;介绍Rete、Treat、Leaps和Matchbox四种典型的前向推理顺序模式匹配算法,分析研究了各个算法使用的提高匹配效率的技术及其优缺点,并对模式匹配算法当前研究进展和规则软件系统的应用现状进行了阐述.  相似文献   

10.
对网络入侵检测系统中的多模式匹配算法进行研究,重点介绍AC-BNFA算法的匹配过程,并根据AC-BNFA的匹配特点对其进行优化。实验结果表明,优化后的匹配算法能改善模式匹配处理速度。  相似文献   

11.
Schema matching is the task of providing correspondences between concepts describing the meaning of data in various heterogeneous, distributed data sources. It is recognized to be one of the basic operations required by the process of data and schema integration and its outcome serves in many tasks such as targeted content delivery and view integration. Schema matching research has been going on for more than 25 years now. An interesting research topic, that was largely left untouched involves the automatic selection of schema matchers to an ensemble, a set of schema matchers. To the best of our knowledge, none of the existing algorithmic solutions offer such a selection feature. In this paper we provide a thorough investigation of this research topic. We introduce a new heuristic, Schema Matcher Boosting (SMB). We show that SMB has the ability to choose among schema matchers and to tune their importance. As such, SMB introduces a new promise for schema matcher designers. Instead of trying to design a perfect schema matcher, a designer can instead focus on finding better than random schema matchers. For the effective utilization of SMB, we propose a complementary approach to the design of new schema matchers. We separate schema matchers into first-line and second-line matchers. First-line schema matchers were designed by-and-large as applications of existing works in other areas (e.g., machine learning and information retrieval) to schemata. Second-line schema matchers operate on the outcome of other schema matchers to improve their original outcome. SMB selects matcher pairs, where each pair contains a first-line matcher and a second-line matcher. We run a thorough set of experiments to analyze SMB ability to effectively choose schema matchers and show that SMB performs better than other, state-of-the-art ensemble matchers.  相似文献   

12.
Schema matching and value mapping across two heterogenous information sources are critical tasks in applications involving data integration, data warehousing, and federation of databases. Before data can be integrated from multiple tables, the columns and the values appearing in the tables must be matched. The complexity of the problem grows quickly with the number of data attributes/columns to be matched and due to multiple semantics of data values. Traditional research has tackled schema matching and value mapping independently. We propose a novel method that optimizes embedded value mappings to enhance schema matching in the presence of opaque data values and column names. In this approach, the fitness objective for matching a pair of attributes from two schemas depends on the value mapping function for each of the two attributes. Suitable fitness objectives include the euclidean distance measure, which we use in our experimental study, as well as relative (cross) entropy. We propose a heuristic local descent optimization strategy that uses sorting and two-opt switching to jointly optimize value mappings and attribute matches. Our experiments show that our proposed technique outperforms earlier uninterpreted schema matching methods, and thus, should form a useful addition to a suite of (semi) automated tools for resolving structural heterogeneity.  相似文献   

13.
获取模式信息是深入研究Deep Web数据的必要步骤,针对Deep Web结果模式结构信息的丢失问题,提出了一种基于启发式信息的Deep Web结果模式获取方法.通过解析Deep Web结果页面数据,利用启发式信息为结果页面数据添加正确的属性名,进而得到对应Deep Web的结果模式,并对其进行规范化处理,解决不同数据...  相似文献   

14.
模式匹配研究进展   总被引:2,自引:0,他引:2  
随着网络和信息技术的发展,各个应用领域的合作越来越密切,数据的互操作性日显重要。由于数据源数据模式的自治性、异构性,为实现数据共享,模式匹配已成为数据密集型分布式应用的一项基本任务,成为学术界近年来的一个研究热点。对模式匹配的研究现状和趋势作了简述:介绍了模式匹配的基本技术及分类,分析并比较了典型的模式匹配系统,讲述了模式匹配的发展趋势。  相似文献   

15.
基于函数依赖的结构匹配方法   总被引:2,自引:0,他引:2  
李国徽  杜小坤  胡方晓  杨兵  唐向红 《软件学报》2009,20(10):2667-2678
模式匹配是模式集成、数据仓库、电子商务以及语义查询等领域中的一个基础问题,近来已经成为研究的热点,并取得了丰硕的成果.这些成果主要利用元素(典型的为关系模式中的属性)自身的信息来挖掘元素语义,目前,这方面的研究已经相当成熟.结构信息作为模式中一种重要的信息,能够为提高模式匹配的精确性提供有用的支持,但是目前关于如何利用结构信息提高模式匹配的精确性的研究还很少.将模式元素之间的相似度分为语义相似度(根据元素自身信息得到的相似度)和结构相似度(根据元素之间的关联关系得到的相似度),并采用新的统计方法计算元素间的结构相似度,然后再综合考虑语义相似度得到元素间的相似概率;最后根据相似概率得到模式元素间的映射关系(模式元素之间的对应关系).实验结果表明,该算法在查准率、查全率及全面性等方面都优于已有的其他算法.  相似文献   

16.
模式匹配是确定模式间语义匹配关系的技术,它在许多应用中起着重要的作用,如数据集成中异构模式信息整合、本体知识映射、电子商务中消息映射等。针对已有模式匹配方法的局限性,本着最大限度地减少人工干预使模式匹配自动化的原则,本文提出一种利用模式结构信息和已有匹配知识的模式匹配模型SMGM。它借鉴神经网络元间影响作用过程实现语义匹配推理;通过重用已有匹配知识,补充、精化匹配知识,自动缩减不确定阈值区间;并给出一种自适应式迭代挖掘求精已有匹配知识的自学习型模式匹配模型。实验表明:SMGM模型切实可行。  相似文献   

17.
A survey of approaches to automatic schema matching   总被引:76,自引:1,他引:75  
Schema matching is a basic problem in many database application domains, such as data integration, E-business, data warehousing, and semantic query processing. In current implementations, schema matching is typically performed manually, which has significant limitations. On the other hand, previous research papers have proposed many techniques to achieve a partial automation of the match operation for specific application domains. We present a taxonomy that covers many of these existing approaches, and we describe the approaches in some detail. In particular, we distinguish between schema-level and instance-level, element-level and structure-level, and language-based and constraint-based matchers. Based on our classification we review some previous match implementations thereby indicating which part of the solution space they cover. We intend our taxonomy and review of past work to be useful when comparing different approaches to schema matching, when developing a new match algorithm, and when implementing a schema matching component. Received: 5 February 2001 / Accepted: 6 September 2001 Published online: 21 November 2001  相似文献   

18.
基于《知网》的中文Deep Web模式匹配算法研究   总被引:1,自引:1,他引:0  
金玉  范学峰 《计算机应用研究》2009,26(10):3750-3753
随着数据库在Internet中的应用日益广泛,Deep Web集成(即Web数据库集成)成为当前信息领域的研究热点,模式匹配是Deep Web查询接口集成中的一个关键问题。目前大多数这方面的研究都是基于英文的,针对这种情况,探讨了中文Deep Web查询接口的模式匹配方法,并提出了一种基于《知网》、面向中文语义的模式匹配算法,并利用属性在查询接口上的相对位置信息解决语义冲突。手工收集查询表单对算法进行验证,实验表明该方法能使得接口之间属性匹配的正确率达到90 %以上。  相似文献   

19.
20.
一种有效的贪婪模式匹配算法   总被引:2,自引:0,他引:2  
模式匹配问题是意图获得两个模式中所包含个体对象之间的语义匹配和映射,其结果表示源模式的个体对象与目标模式的个体对象之间存在特定的语义关联.它在数据库应用领域起到关键性的作用,例如数据集成、电子商务、数据仓库、XML消息交换等,特别地,它已成为元数据管理的基本问题.然而,模式匹配很大程度上依赖人工的操作,是一个费时费力的过程.模式匹配问题可以归约为一个组合优化问题:多标记图匹配问题.首先,将模式表示为多标记图,将模式匹配转换为多标记图匹配问题.其次,提出多标记图的相似性度量方法,进而提出基于多标记图相似性的模式匹配目标优化函数.最后,在这个目标函数基础上设计实现了一个贪婪匹配算法,其最显著的特点是综合多种可用的标记信息,灵活准确地获得最优的匹配结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号