首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
异构数据源间的模式匹配技术是数据共享应用设计的基本步骤。提出了一种新型的模式匹配方法——基于数据源信息语境的复杂模式匹配方法,它采用考虑数据源的信息语境来计算复杂匹配,能够有效地解决复杂匹配时产生的候选匹配查询空间过大的问题。该方法首先从数据源的信息语境中抽取复杂概念,并将抽取的复杂概念添加到原有数据源中,然后通过模式匹配模块计算数据源间的概念匹配。实验表明,该方法不仅能大大降低候选匹配查询空间的规模,而且能够提高模式匹配的查全率和查准率。  相似文献   

2.
针对目前大多数模式匹配方法在应用于不同的匹配任务时,多策略结合时没有充分利用模式间的语义信息的问题,提出了一种改进的多策略匹配方法。该方法对部分关键匹配策略进行了改进,并通过对多策略的评价,考虑是否利用模糊综合评判法最优地结合各种策略。实验表明,该方法在保证通用性和稳定性的同时,提高了匹配结果的查全率和查准率。在现实的Web异构数据源场景中应用该方法,得到的查准率和查全率都很高,证明了该方法的正确性和有效性。  相似文献   

3.
Deep Web中用户通常是通过一个统一的查询接口获得其中的数据信息.目前查询接口一般需要形成属性间的模式匹配,为了提高m:n模式匹配的准确率和查全率,本文提出一种基于聚类的复杂模式匹配的算法CSM,从整体上匹配成组属性和同义属性,能够有效的发现m:n匹配,并有较高的准确率.  相似文献   

4.
宋亚楠  仲茜  钟远 《计算机工程》2011,37(13):63-65
提出一种基于多属性的本体实例匹配算法,利用关键性属性获得待匹配本体实例间的相似度,使用Similarity Flooding算法,依据由对象属性构成的有向图对实例间的相似度进行修正,并获得初始匹配结果,根据必要性属性过滤初始匹配中的错误匹配。实验结果表明,该算法可提高本体实例匹配的查准率与查全率。  相似文献   

5.
模式匹配是数据集成和数据转换中的重要问题.现有的模式匹配方法大多集中于发掘模式间的1:1匹配,然而,在现实世界模式之间除了1:1匹配还包括很多的复杂匹配.提出一种基于全集的复杂模式匹配方法,它可应用模式和映射的全集为被匹配模式添加信息;然后,利用多个具有特殊目的的检索程序分别对候选空间的特殊部分进行检索,发掘1:1和复杂匹配;最后通过学习全集中元素及元素间关系的统计,自动推导出可过滤候选匹配的约束,生成最优的匹配.实验表明,该方法不仅能全面地发掘模式间匹配,与其他复杂模式匹配方法相比,还具有较高的查全率和查准率.  相似文献   

6.
模式匹配是数据集成和数据转换中的重要问题.现有的模式匹配方法大多集中于发掘模式间的1:1匹配,然而,现实世界模式之间除了1:1匹配还包括许多的复杂匹配.本文提出一种新的发掘数据库模式问复杂匹配的方法--CSM(Complex Schema Matching),它在全面发掘模式问1:1和复杂匹配的同时,还可进一步找到不透明列间的匹配关系.实验表明,CSM不仅能全面的发掘模式间匹配,与其它模式匹配方法相比,还具有较高的查全率、查准率和效率.  相似文献   

7.
李蓉蓉  王晖  陈冉 《计算机科学》2011,38(12):151-155
近年来,模式匹配作为Web信息集成管理与应用中的重要问题,得到了广泛关注和研究。已有模式匹配方法大多是基于模式信息的,对数据实例信息利用则较少。针对数据集成环境下模式信息不全或存在冲突的模式信息导致模式匹配结果不正确的问题,给出了计算属性间语义相似性的方法以提高模式匹配的性能,分析了模式内语义相近多属性间的语义差别,进一步给出了基于带权二分图最大化算法的模式匹配方法。通过实验,说明基于实例集合语义相似的模式匹配方法能在模式信息不全面或存在冲突的情况下,得到更完整、更准确的模式匹配。  相似文献   

8.
模式匹配是模式集成、数据仓库、电子商务以及语义查询等领域中的一个难点.它主要利用元素自身信息(如元素名、数据类型等信息)、数据实例信息(模式中的数据)和结构信息(模式元素相互关联的关系)来挖掘元素语义以获得正确的映射关系.文中介绍了一种将数据实例信息与结构信息相结合来辅助匹配的新方法.此方法首先根据模式对应的数据实例信息来计算模式元素间的部分函数依赖度(模式结构信息),然后根据部分函数依赖关系建立模式元素间的依赖图,再根据元素依赖图计算元素间的结构相似度,最后得到模式元素间的映射关系.由于利用了更多的结构信息辅助匹配,所以文中方法在性能上要优于其它仅使用完全函数依赖结构信息进行匹配的方法.实验表明此方法在查准率、查全率以及全面性等各个指标上都优于已有的其它方法.  相似文献   

9.
《计算机科学与探索》2017,(9):1389-1397
数据模式匹配是异构数据源数据合并过程中的核心环节,属于数据集成中的关键问题。目前已有许多数据模式匹配方法,但其中很大一部分方法由于过多依赖数据模式描述信息,导致通用性不足,很难应用于其他场景中。为此,提出了一种利用有序互信息的匹配包含非透明列名和列数据值的数据模式。该方法不依赖诸如列名、列类型、主外键依赖等数据模式描述信息,因此具有很强的通用性。在多个数据集上实验结果表明,该方法能够在大幅降低匹配花费时间的同时提高匹配结果的准确率。  相似文献   

10.
随着互联网和生物信息的飞速发展,即时发现新的生物信息数据源来进行研究变得非常重要.传统的基于的搜索引擎由于忽视了关键词本身所含的语义信息而得到较低的查全率和查准率,文中提出了基于本体的生物信息数据源发现的方法.通过本体描述的领域知识和反映文档信息的特征短语来语义扩充用户请求,从而提高了检索的查全率和查准率.  相似文献   

11.
获取模式信息是深入研究Deep Web数据的必要步骤,针对Deep Web结果模式结构信息的丢失问题,提出了一种基于启发式信息的Deep Web结果模式获取方法.通过解析Deep Web结果页面数据,利用启发式信息为结果页面数据添加正确的属性名,进而得到对应Deep Web的结果模式,并对其进行规范化处理,解决不同数据...  相似文献   

12.
基于《知网》的中文Deep Web模式匹配算法研究   总被引:1,自引:1,他引:0  
金玉  范学峰 《计算机应用研究》2009,26(10):3750-3753
随着数据库在Internet中的应用日益广泛,Deep Web集成(即Web数据库集成)成为当前信息领域的研究热点,模式匹配是Deep Web查询接口集成中的一个关键问题。目前大多数这方面的研究都是基于英文的,针对这种情况,探讨了中文Deep Web查询接口的模式匹配方法,并提出了一种基于《知网》、面向中文语义的模式匹配算法,并利用属性在查询接口上的相对位置信息解决语义冲突。手工收集查询表单对算法进行验证,实验表明该方法能使得接口之间属性匹配的正确率达到90 %以上。  相似文献   

13.
基于结果模式的Deep Web数据抽取   总被引:3,自引:0,他引:3  
高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式生成和数据抽取两个阶段,属性语义标注放在结果模式生成阶段来完成,有效解决了重复语义标注问题;同时针对嵌套属性问题,提出一种有效的解决方法.与同类成果相比,基于结果模式的数据抽取方法提高了数据抽取的准确率及效率,并且为Deep Web数据集成奠定了良好的基础.  相似文献   

14.
一种基于数据挖掘的Deep Web模式匹配方法   总被引:1,自引:0,他引:1  
模式匹配是Deep Web异构信息集成中的关键问题.介绍了一种整体性匹配方法,即同时发现大量模式,并一次性进行匹配.主要通过分析和比较两种已经存在的大规模模式匹配原型系统:MGS和DCM,结合它们核心算法的优点,提出一种新的基于数据挖掘技术的算法(Correlated-clustering).该算法先利用积极相关发现组匹配,再通过概念相似度的计算聚类同义属性,最后进行匹配选择.实验结果表明,本算法全面、效率高,充分体现了整体性方法的思想.  相似文献   

15.
李明  李秀兰 《计算机应用》2011,31(7):1733-1736
全面准确地标注Deep Web查询结果是Deep Web数据集成的关键问题,但现有的Web数据库标注方法还不能较好地解决该问题,为此提出一种基于结果模式的Deep Web数据标注方法。首先通过结果页面解析和抽取结构化数据来完成数据预处理的工作,并在集成结果模式和待标注数据之间建立正确的语义映射,进而确定Deep Web数据的标注信息。通过对4个领域Web数据库进行实验测试,结果表明所提方法能有效地标注Deep Web查询结果数据。  相似文献   

16.
冯永  张洋 《计算机应用》2012,32(6):1688-1691
查询接口模式匹配是Deep Web信息集成中的关键部分,双重相关性挖掘方法(DCM)能有效利用关联挖掘方法解决复杂接口模式匹配问题。针对DCM方法在匹配效率、匹配准确性方面的不足,提出了一种基于匹配度和语义相似度的新模式匹配方法。该方法首先使用矩阵存储属性间的关联关系,然后采用匹配度计算属性间的相关度,最后利用语义相似度计算候选匹配的相似性。通过在美国伊利诺斯大学的BAMM数据集上进行实验,所提方法与DCM及其改进方法比较有更高的匹配效率和准确性,表明该方法能更好地处理接口之间模式匹配问题。  相似文献   

17.
FiVaTech: Page-Level Web Data Extraction from Template Pages   总被引:1,自引:0,他引:1  
Web data extraction has been an important part for many Web data analysis applications. In this paper, we formulate the data extraction problem as the decoding process of page generation based on structured data and tree templates. We propose an unsupervised, page-level data extraction approach to deduce the schema and templates for each individual Deep Website, which contains either singleton or multiple data records in one Webpage. FiVaTech applies tree matching, tree alignment, and mining techniques to achieve the challenging task. In experiments, FiVaTech has much higher precision than EXALG and is comparable with other record-level extraction systems like ViPER and MSE. The experiments show an encouraging result for the test pages used in many state-of-the-art Web data extraction works.  相似文献   

18.
Deep Web集成服务的不确定模式匹配   总被引:5,自引:0,他引:5  
随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模式之间以及集成查询接口模式与Web数据库查询接口模式之间的匹配关系,是Deep Web集成服务中进行合理的用户请求转换的关键.之前的相关工作都是寻找最佳的匹配结果,回避匹配的不确定性,丢弃了可能有价值的其他匹配结果.文中首先剖析了请求转换中模式匹配的不确定性,提出了数字类型的相似度计算方法,给出了进行数字类型的模式匹配的有效的剪枝方法以及数据类型驱动的模式匹配优化方法,并在此基础上提出了一种基于相似度计算的不确定性模式匹配方法,最后通过大量的实验证明了该方法的有效性.  相似文献   

19.
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。  相似文献   

20.
基于关联规则的Deep Web查询接口集成   总被引:1,自引:0,他引:1       下载免费PDF全文
论述查询接口集成的相关工作,提出基于查询单项间关联规则的接口模式匹配方法解决查询接口集成中模式匹配问题,同时给出复杂模式匹配处理方法。以图书、房产等领域为实验对象,模式匹配的平均准确率达到91.6%,匹配中能准确发现复杂模式匹配,表明该方法具有较好的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号