首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 131 毫秒
1.
为了产生语义Web中的元数据,需要提取Web文档中的语义信息。面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法。语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于n-gram的语义消歧方法。采用这种方法对文档进行语义标注,将标注结果持久化为语义索引,为实现语义信息检索提供基础。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。  相似文献   

2.
网络图像语义自动标注是实现对互联网中海量图像管理和检索的有效途径,而自动有效地挖掘图像语义是实现自动语义标注的关键。网络图像的语义蕴含于图像自身,但更多的在于对图像语义起不同作用的各种描述文本,而且随着图像和描述知识的变化,描述文本所描述的图像语义也随之变化。提出了一种基于领域本体和不同描述文本语义权重的自适应学习的语义自动标注方法,该方法从图像的文本特征出发考查它们对图像语义的影响,先通过本体进行有效的语义快速发现与语义扩展,再利用一种加权回归模型对图像语义在其不同类型描述文本上的分布进行自适应的建模,进而实现对网络图像的语义标注。在真实的Wcb数据环境中进行的实验中,该方法的有效性得到了验证。  相似文献   

3.
互联网上存在海量数据,如何在大量的信息中查找到有用信息就变成了一个至关重要的问题。语义网为解决这一问题带来了曙光。然而当今网络现状与语义网之间存在巨大差距,即海量非结构化的页面内容难直接转化为语义的知识。提出了一种基于文档内容的语义标注方法,利用本体所表达的语义环境,即本体知识相关词汇及其所处的语义上下文环境在文档中出现频率,实现对文档的语义标注。实验显示方法取得良好的效果,但受本体知识质量和标注文档质量两个因素影响较大。  相似文献   

4.
魏墨济  于涛 《计算机应用》2011,31(8):2138-2142
提出了一种标注方法实现语义网中无结构专业文档的自动标注。通过分析给出专业文档的两方面特征,并提出了三个假设。为提高标注效率,基于结构对本体进行分割,将本体划分成具有较高语义独立性的片断;然后利用从专业文档中抽取的关键词定位本体片断;最后,使用选中的片断,利用语法结构和三元组的对应性对文档进行标注。实验结果表明,所提出方法在标注效率、标注数量和准确性三个方面都有所提高。  相似文献   

5.
通过对Internet上的模具知识特点的分析,提出了一种基于模具本体的语义标注方法,对Internet上的模具知识进行描述,并结合 实例对该方法进行了说明.该方法使用基于模具本体的向量空间模型(VSM)方法,将从页面中提取的特征词,用领域本体进行理解、扩充,然后基于改进后的TFIDF算法,求出扩充后每个特征词的权值.通过这种方法对网页文档进行语义标注后,可以把文档隐含语义信息显式地表现出来,为模具知识搜索引擎的设计提供了基础.  相似文献   

6.
在甲骨文领域本体语义环境的基础上,提出一种针对甲骨文卜辞这种特殊结构的文档进行语义标注的方法。为提高标注的准确率,分析甲骨文特有的特征,并针对这种特殊的文档提出一系列规则。该方法首先对甲骨片上的卜辞信息进行分解,然后在甲骨文本体知识的指导下进行概念抽取。对于每个具体的实例概念在本体知识库中寻找其语义环境信息。按照所提出的规则分别计算这些信息与具体一条卜辞的重要度,最后以三元组的形式把标注信息存放于标注库中。实验结果表示,该方法依据领域本体的语义环境大大提高了标注的准确率。  相似文献   

7.
针对现有语义标注系统效率低下的现状,借鉴NCBO Annotator的思想,提出了一种基于语义的文档标注方法,旨在结合本体知识库和WordNet的语义知识,构建具有丰富语义描述能力的字典库,并利用字典库实现文档的语义标注.实验表明,本方法能够提高搜索资源的语义,进而提高搜索的准确度.此外,利用本方法还可提供语义扩展搜索.最后将字典库和标注过程以RESTful Web Service的方式呈现,极大地方便了广大用户对字典库和语义资源的使用.  相似文献   

8.
桑成  程健  史一明 《计算机应用》2017,37(6):1728-1734
为了解决闭环全生命周期管理系统中知识相互独立、无法共享的问题,针对闭环全生命周期特点,提出了一种知识集成与语义标注方法。首先,简要阐述了闭环全生命周期管理系统中知识集成与语义标注的内涵;其次,利用本体技术对低温等离子体设备构建了多维度、多层次知识集成框架;然后,在此基础上,给出了知识文档语义标注流程,设计出一种文档语义向量与本体语义向量的提取与匹配计算方法,完成了低温等离子体设备中一个子系统的知识文档语义标注。设计测试实验并进行验证,实验结果表明,利用闭环全生命周期管理系统中的知识文档数据集进行语义标注,平均准确率达到84%,平均召回率达到79%。所提知识集成与语义标注方法可以实现知识文档在闭环全生命周期管理系统中的共享与重用。  相似文献   

9.
提出一种基于领域服务本体的语义标注方法.并结合电力系统领域本体对该方法进行实例说明,该方法通过分析文档(或者网页)的关键信息,使用基于OWL-S本体的语义描述方法建立关键信息与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的Web服务信息显式地表现出来,这样多个文档(或者网页)之间就具有语义关联关系.为服务的语义解析及智能监控提供基础.  相似文献   

10.
在服务网格中,分布式网络计算的实现依赖于如何在OGSA下实现服务交互问题的有效解决.为此,服务接口必须采用机器可理解的方式描述,从而为网格服务的动态发现和组合提供底层支持.服务语义标注技术满足了上述需求,它提出使用共享域本体中机器可理解的元数据标注服务资源描述.提出了一种有效的服务资源自动语义标注方法,该方法将服务语义标注过程分解为域标注和概念标注两个阶段,重点针对域标注问题,提出了基于机器学习的域标注算法,对实际服务资源的标注实验验证了该算法的有效性.  相似文献   

11.
Automatic ontology-based knowledge extraction from Web documents   总被引:4,自引:0,他引:4  
To bring the Semantic Web to life and provide advanced knowledge services, we need efficient ways to access and extract knowledge from Web documents. Although Web page annotations could facilitate such knowledge gathering, annotations are rare and will probably never be rich or detailed enough to cover all the knowledge these documents contain. Manual annotation is impractical and unscalable, and automatic annotation tools remain largely undeveloped. Specialized knowledge services therefore require tools that can search and extract specific knowledge directly from unstructured text on the Web, guided by an ontology that details what type of knowledge to harvest. An ontology uses concepts and relations to classify domain knowledge. Other researchers have used ontologies to support knowledge extraction, but few have explored their full potential in this domain. The paper considers the Artequakt project which links a knowledge extraction tool with an ontology to achieve continuous knowledge support and guide information extraction. The extraction tool searches online documents and extracts knowledge that matches the given classification structure. It provides this knowledge in a machine-readable format that will be automatically maintained in a knowledge base (KB). Knowledge extraction is further enhanced using a lexicon-based term expansion mechanism that provides extended ontology terminology.  相似文献   

12.
罗军  高琦  王翊 《计算机工程》2010,36(23):85-87
实现语义Web目标的一个重要前提是利用本体词汇标注Web资源。为此,提出一种基于弱监督(Bootstrapping)的本体标注方法。对给定的本体进行解析,生成规则文件,通过文本分类筛选出领域文档。采用Bootstrapping的方法进行信息标注抽取和本体推理,经过几次循环后,只利用少量的训练文本就能达到较好的标注效果。实验证明,该方法实体识别准确率高,标注效果好。  相似文献   

13.
Ontology is playing an increasingly important role in knowledge management and the Semantic Web. This study presents a novel episode-based ontology construction mechanism to extract domain ontology from unstructured text documents. Additionally, fuzzy numbers for conceptual similarity computing are presented for concept clustering and taxonomic relation definitions. Moreover, concept attributes and operations can be extracted from episodes to construct a domain ontology, while non-taxonomic relations can be generated from episodes. The fuzzy inference mechanism is also applied to obtain new instances for ontology learning. Experimental results show that the proposed approach can effectively construct a Chinese domain ontology from unstructured text documents.  相似文献   

14.
唐攀  王红卫  王喆  刘丹 《计算机应用研究》2011,28(11):4160-4165
目前,应急预案是分布于多个单位的非结构化文档,缺乏统一的建模方法,造成对预案描述的领域知识进行表示和利用存在困难。为解决以上问题,提出一种基于本体的知识建模方法,对应急预案文本进行建模,并实现应急领域知识共享。根据对应急预案文本结构特征进行分析,在重用现有本体模型的基础上提出了各主要要素的本体模型,形成一种应急预案本体模型(emergency plan ontology model,EPOM)。通过利用该方法对某区域防汛应急预案进行本体知识建模,开展应用研究。应用结果表明,该方法能够有效建模应急预案描述的  相似文献   

15.
16.
柯昌博  黄志球  刘林源  曹子宁 《软件学报》2012,23(10):2665-2678
Web Service已经成为主要的计算资源和软件的主要存在形态.为了满足用户的各种需求,使得Web服务的数量快速增加,而能从大量的服务中准确地发现满足用户需求的服务,成为研究热点和难点.结合成熟的基于概念相似度的服务匹配方法,分别将用户需求和语义Web服务描述文档OWL-S profile转化为本体树,并采用分层、分类的方式分别计算对应节点的概念相似度、属性相似度和结构相似度,有效地避免了复杂的推理.根据概念相似度和结构相似度之间的关系定义一系列的约束,并利用约束对查询树进行重组,以提高服务发现的查准率和查全率.最后,给出了语义Web服务发现的算法,并通过开发原型系统OWLS-CSR进行实验,证明了该理论方法的可行性与有效性.  相似文献   

17.
Conventional thought from the Semantic Web community equates the use of ontologies with the representation of the meaning of content. Here, we skew this viewpoint by describing our ontology, Web Authoring for Accessibility (WAfA), which investigates the way ontologies can describe the semantic structure of documents. By understanding the way heterogeneous XHTML (Extensible Hypertext Mark-up Language) documents are structured we can better transform documents, currently inaccessible to visually impaired users. WAfA performs two tasks: (1) it allows us to flexibly model an XHTML document within the context of navigation and orientation through the Web resource; (2) it enables non-expert users to quickly annotate a Web document by providing a ‘lingua franca’ between author and Web Accessibility Domain Experts. Here we describe our ontology, its use, novelty, and importance.  相似文献   

18.
基于Web数据的本体概念抽取   总被引:1,自引:0,他引:1  
本体论(Ontology)在知识管理及语义网(Semantic Web)中越来越重要,但建造本体往往需要耗费大量的时间,且建造完成后本体的维护对知识管理者来说也是费时的工作。自动创建领域Ontology可以克服手工方法的不足,成为当前的研究热点之一;而概念是本体中最重要的组成部分之一,从半结构化的Web文档中自动抽取概念的效率和准确度的高低,直接决定了自动建造的本体的质量,提出一种自动的本体概念抽取模型,此模型不依赖于领域词典或核心本体,并且能达到快速有效地通过对中文Web文本挖掘自动地构建及更新领域本体概念的目的。  相似文献   

19.
中文网页语义标注:由句子到RDF表示   总被引:5,自引:0,他引:5  
语义网远景的实现需要自动化的语义标注方法,提出了一种在领域本体指导下,针对中文网页的语义标注方法,运用统计学方法与自然语言处理技术,以文档中句子为处理对象,采取识别和组合两个阶段来完成句子向RDF表示的映射,它具有以下特点:以统计方法获得领域相关词汇,构造领域词汇标注列表作为外部领域知识,降低对通用语言本体的依赖;显式的属性类型标注方法识别出句子中表达关系的词汇,标注为属性类型,利于后续关系抽取;构造句子的句法依存关系树(森林),按照依存关系对词汇进行组合,形成RDF陈述.实验结果显示此方法较基于主谓宾语法关系的语义标注方法更为有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号