首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于Wikipedia的语义元数据生成   总被引:1,自引:0,他引:1  
语义元数据提供数据的语义信息,在数据的理解、管理、发现和交换中起着极为重要的作用。随着互联网上数据爆炸式的增长,对自动元数据生成技术的需求也就变得更加迫切。获得目标语义元数据及得到足够的训练语料是使用自动生成技术的两个基本问题。由于获得目标语义元数据需要专家知识,而获得足够的训练语料需要大量的手工工作,这也就使得这两个问题在构建一个成功的系统时至关重要。该文基于Wikipedia来解决这两个问题通过分析一个类别中条目的目录表(table-of-contents)来抽取目标语义元数据,通过对分析文档结构和赋予目标结构正确的语义元数据来构建训练语料库。实验结果表明,该文的方法能够有效地解决这两个问题,为进一步的大规模的语义元数据应用系统打下了坚实的基础。  相似文献   

2.
基于元数据的关系数据库语义集成方法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种基于元数据的关系数据库语义集成方法,将关系数据库动态转换成具有丰富语义的虚拟资源描述框架(RDF)视图,使关系数据库中的数据成为语义网上可以被机器理解和处理的“智能数据”。介绍语义集成框架并分析关系数据库与领域本体语义映射的原理和方法,提出语义元数据描述模型。分析语义查询分解与转换的方法,描述原型系统的实现与应用情况。  相似文献   

3.
随着新闻行业和互联网的飞速发展,新闻信息的数量以爆炸般的速度不断增长,制订统一的新闻信息技术标准成为在全国范围内实现新闻信息交流、共享的紧迫任务,该文在笔者参加的国家“十五”重大科技攻关专项——“中文新闻信息技术标准”项目研究基础上,对国内外各种新闻技术标准的研究成果进行了介绍,特别对基于语义的新闻元数据建模的思想方法进行了探讨和论述。  相似文献   

4.
语义元数据是有关Web内容语义信息的数据描述,它的有效表示及生成是构建语义Web的关键性技术。本文在讨论各种语义元数据的表示方法后,研究语义元数据的生成技术,在分析现有技术的特点和不足后,评述语义元数据生成技术的发展趋势。  相似文献   

5.
提出了一种基于规则和学习相结合的元数据分类存储的方法,该方法通过统计分析,提取对元数据分类影响较大的通用特征规则,对无法用规则分类的元数据,采用文本学习方法,将元数据记录看成由多个属性字段组成的文本,通过构造分类器实现分类。实验结果表明,采用元数据分类存储方法具有良好的检索性能。  相似文献   

6.
对象存储系统中自适应的元数据负载均衡机制   总被引:1,自引:0,他引:1  
陈涛  肖侬  刘芳 《软件学报》2013,24(2):331-342
面向对象的存储系统在研究、工程以及服务领域均得到了广泛的应用.在面向对象的存储系统中,元数据的负载均衡对于提高整个系统的I/O性能具有重要的作用.现有的元数据负载均衡策略不能动态地平衡元数据的访问负载,而且自适应性以及容错特性有待提高.提出了一种自适应的分布式元数据负载均衡机制(adaptabledistributed load balancing of metadata,简称ADMLB),包含基本的负载均衡算法和分布式的增量负载均衡算法.采用基本的负载均衡算法按照服务器的性能公平地分布负载,使用分布式的负载均衡算法定时地调整负载的分布.ADMLB采取分布式的方法均衡地在元数据服务器之间分布负载,根据负载的变化自适应地进行调整,具有很好的容错特性,而且用户可以高效地定位元数据服务器.  相似文献   

7.
在基于公共仓库元模型(CWM)建立元数据的过程中,参与建立元数据的团体的不同经验以及描述数据的不同视角不可避免地带来元数据的冲突和冗余等问题,然而CWM的图形化特点使之缺乏精确的语义,所以如何在其上进行推理以自动发现这些问题至今没有得到很好的解决.研究了利用描述逻辑--一个一阶谓词逻辑的可判定子集形式化CWM元模型和元数据并进行推理的方法,将一致性检测分为水平一致性和演化一致性分别处理,在处理演化一致性的过程中对CWM元模型进行了扩展,使之支持元数据的版本能力从而能够推理由于演化引起的不一致问题,然后利用推理引擎LOOM对两种情形进行推理检测以发现不一致信息,取得了令人满意的结果,表明提出的方法是可行的.  相似文献   

8.
基于OAI的数字图书馆中元数据互操作框架   总被引:30,自引:1,他引:30  
提出一种基于最新的元数据互操作协议———OAI的元数据互操作框架。文章给出了框架中各个组件的模块及功能说明,并说明各模块之间的交互。这种框架克服了以前人们所提出的其他集成方法过于复杂、难于实施的缺点。  相似文献   

9.
使用Web Services技术可使多个信息源共同向客户提供信息,形成较理想的分布式应用。但源于多数据源的数据在格式上并不统一,如何处理这些异构数据成为需要解决的问题。UDDI是用于发现有用Web服务的技术,如果能将对异构数据源的描述信息加入其中,则有助于异构数据的处理。本文给出了一种可行的方法来实现这一目的,实验证明在基于Web的分布式系统中应用有较好效果。  相似文献   

10.
佘楚玉  温武少  肖扬  刘育擘  贾殷 《软件学报》2017,28(8):1952-1967
随着大数据时代的到来,全球信息存储量呈现爆发式的增长,传统的存储系统在存储性能、存储容量、数据可靠性和成本等方面存在诸多不足。近年来,以云计算平台为依托的存储技术得到了飞速的发展,成为了处理海量数据的重要工具。本文针对分布式文件系统元数据管理的问题,提出了一种自适应元数据服务负载均衡策略。该策略主要包括以下三点内容:第一,介绍了一种实时的元数据服务器的性能评价模型;第二,提出了一种基于服务器负载变化的检测周期自适应调整机制;第三,提出了一种基于元数据服务器性能指标的自适应负载均衡算法。实验证明了该方法的可行性,有效性和稳定性。  相似文献   

11.
伪平行句对抽取是缓解汉-越低资源机器翻译中数据稀缺问题的关键任务,同时也是提升机器翻译性能的重要手段。传统的伪平行句对抽取方法都是基于语义相似性度量,但是传统基于深度学习框架的语义表征方法没有考虑不同词语语义表征的难易程度,因此导致句子语义信息不充分,提取到的句子质量不高,噪声比较大。针对此问题,该文提出了一个双向长短期记忆网络加语义自适应编码的语义表征网络框架,根据句子中单词表征难易的不确定性,引导模型使用更深层次的计算。具体思路为: 首先,对汉语和越南语句子进行编码,基于句子中单词语义表征的难易程度,自适应地进行表征,深度挖掘句子中不同单词的语义信息,实现对汉语和越南语句子的深度表征;然后,在解码端将深度表征的向量映射到统一的公共语义空间中,最大化表示句子之间的语义相似度,从而提取更高质量的汉-越伪平行句子。实验结果表明,相比于基线模型,该文提出的方法在F1得分上提升5.09%,同时将提取到的句子对用于训练机器翻译模型,实验结果表明翻译性能的显著提升。  相似文献   

12.
基于语义覆盖网络的信息组织与服务体系框架   总被引:1,自引:0,他引:1       下载免费PDF全文
针对广域网络环境下面向用户需求的信息服务要求,本文设计了一种基于语义覆盖网络的信息组织与服务体系框架。该框架充分考虑用户的信息需求与信息体系,提供了一种趋于扁平化的信息共享与服务环境。该框架通过自底向上和自顶向下相结合的信息组织模式,在信息资源中心完成基于语义的信息整合与组织的基础上采用基于语义相似度聚类的语义覆盖网络,提供基于语义的信息资源发布、发现与定位的能力。  相似文献   

13.
文章讨论了构建基于语义网的资源型终身学习服务系统的重要性,并提出了资源型终身学习服务系统的系统模型、资源整合模型、资源服务模型、及语义搜索过程模型。资源型终身学习服务系统的构建是一个庞大的系统工程,其中涉及到内容资源的整合与建设、领域本体的构建、教育资源元数据通用规范的建设、学习服务系统的设计与开发等多项重要工作。该文基于中国人民大学网络教育学院承担的2010年国家社科基金研究项目(编号10BTQ009)的初期理论探索成果,今后将在本体构建、资源建设、用户模型建设、系统开发改造等方面开展一系列的实际工作。  相似文献   

14.
基于元数据构建自描述的Web应用框架   总被引:1,自引:0,他引:1  
在Web应用系统中,具有自适应能力的Web应用框架将极大地提高系统的开发、部署和维护效率。基于元数据的表征能力,扩展了MVC设计模式,建立模型元数据、视图元数据、控制元数据,分别对系统中模型、视图和控制进行详细地描述,并利用应用程序元数据对三类元数据之间的关系进行描述,在此基础上,构建了一个自描述的、具有良好自适应性和可扩充性的Web应用框架。  相似文献   

15.
一种基于网格服务的数据库元数据管理框架   总被引:7,自引:0,他引:7  
该文主要针对数据网格的分布式异构数据库环境,提出一种基于网格服务来实现数据库元数据采集、存储、查询功能的参考框架。文章讨论了对于异构数据库的元数据,如何实现动/静态信息的管理。通过扩展GlobusToolkit中的MDS(MonitoringandDiscoverService)目录服务模块,使其支持后台关系型数据库,来存储静态元数据,而利用信息采集程序(InformationProvider)来生成动态元数据。整个系统框架建立在网格服务(GridService)基础之上,以网格服务方式提供元数据的访问功能。  相似文献   

16.
针对数据维护程序代码重复、对需求变化适应性差等问题,提出一种以数据库表的元数据为核心的通用数据维护框架。该元数据模型能描述表之间的一般关系和基于面向对象的继承关系。框架实现了数据操纵SQL语句和数据维护程序界面的自动生成,并能自适应表结构的变化。实际应用验证了该框架的可行性和高效性。  相似文献   

17.
根据各分布信息源信息单元实体类的语义相似度,对于信息单元实体类进行聚类,是半自动地进行本体映射、构建分布异构信息资源全局视图的重要步骤。本文面向分布信息资源统一信息视图构建需求,利用基于本体的元数据模型及语义相似度,在其基础上定义了语义聚类特征,基于语义聚类特征设计了一种基于语义特征树的混合层次聚类算法SCFBHCA。从理论和实验两个角度对SCFBHCA算法进行了分析,对比HCA和HCP,该算法具有增量式和扩展性且效率更高。  相似文献   

18.
基于区块自适应特征融合的图像实时语义分割   总被引:1,自引:0,他引:1  
近年来结合深度学习的图像语义分割方法日益发展, 并在机器人、自动驾驶等领域中得到应用. 本文提出一种基于区块自适应特征融合(Block adaptive feature fusion, BAFF) 的实时语义分割算法, 该算法在轻量卷积网络架构上, 对前后文特征进行分区块自适应加权融合, 有效提高了实时语义分割精度. 首先, 分析卷积网络层间分割特征的感受野对分割结果的影响, 并在跳跃连接结构(SkipNet) 上提出一种特征分区块加权融合机制; 然后, 采用三维卷积进行层间特征整合, 建立基于深度可分离的特征权重计算网络. 最终, 在自适应加权作用下实现区块特征融合. 实验结果表明, 本文算法能够在图像分割的快速性和准确性之间做到很好的平衡, 在复杂场景分割上具有较好的鲁棒性.  相似文献   

19.
王志华  金燕  李占波 《计算机工程》2011,37(11):83-85,88
基于内容的语义Web检索只考虑内容本身,没有考虑用户的不同,不能准确反映用户需求。为此,提出一个自适应语义Web检索框架,对于Web中文文档,借助HowNet知识库给出一种本体学习方法,通过提取用户客观、显式和隐式信息建立用户信息库,并设计用户初始查询本体和个性化查询本体构建算法,从而实现用户的自适应检索。实验结果表明,该方法具有较高的检索效率。  相似文献   

20.
教育资源元数据语义扩展查找方法的研究   总被引:7,自引:0,他引:7  
随着网络教育资源的急剧增长,如何有效地提供教育资源查找服务,成为一项重要而迫切的研究课题.由于教育资源同网格资源一样具有海量、异构、广域分布等特性,于是采用网格资源查找技术中基于元数据的资源查找方法实现教育资源的查找.与其他基于元数据资源查找方法不同的是:利用自动构建的语义关系库,实现教育资源元数据同义扩展、蕴涵扩展、外延扩展以及并列扩展,试图从词所表达的语义层次处理用户的检索请求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号