首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于领域本体的语义标注方法研究   总被引:3,自引:0,他引:3  
介绍了语义Web.本体以及语义标注的基本概念,对语义标注方法以及现有技术工具进行了简单地说明和分析,提出了一种基于领域本体的语义标注方法,并结合石油产品领域的本体对该方法进行了实例说明.该方法通过分析文档的特征词汇,使用基于领域本体的空间向量模型方法建立词汇与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的语义信息显式的表现出来,这样数据库内部文档之间就具有了语义关联关系,为检索的智能推理提供基础.  相似文献   

2.
魏墨济  于涛 《计算机应用》2011,31(8):2138-2142
提出了一种标注方法实现语义网中无结构专业文档的自动标注。通过分析给出专业文档的两方面特征,并提出了三个假设。为提高标注效率,基于结构对本体进行分割,将本体划分成具有较高语义独立性的片断;然后利用从专业文档中抽取的关键词定位本体片断;最后,使用选中的片断,利用语法结构和三元组的对应性对文档进行标注。实验结果表明,所提出方法在标注效率、标注数量和准确性三个方面都有所提高。  相似文献   

3.
提出一种基于领域服务本体的语义标注方法.并结合电力系统领域本体对该方法进行实例说明,该方法通过分析文档(或者网页)的关键信息,使用基于OWL-S本体的语义描述方法建立关键信息与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的Web服务信息显式地表现出来,这样多个文档(或者网页)之间就具有语义关联关系.为服务的语义解析及智能监控提供基础.  相似文献   

4.
语义标注是实现语义网的一个重要研究内容,目前已有很多标注方法取得了不错的效果。但这些方法几乎都没有注意到本体所描述的知识往往稀疏地分布在文档中,也未能有效地利用文档的组织结构信息,使得这些方法对质量较差的文档的标注不理想。为此提出了一种基于稀疏编码的本体语义自动标注方法((Semantic Annotation Method based on Sparse Coding, SAMSC),该方法先按本体知识描述从文档中识别出一定的语义作为初始值,再通过迭代解析文档段落结构和描述主题,完成本体知识与文档资源的相关系数矩阵计算,最后在全局文档空间中通过最小化损失函数来实现用本体对文档的语义标注。实验表明,该方法能有效地对互联网中大量良芬不齐的文档进行自动语义标注,对质量差的文档资源能取得让人接受的结果。  相似文献   

5.
袁柳  张龙波 《计算机应用》2010,30(12):3401-3406
针对已有Web文档语义标注技术在标注完整性方面的缺陷,将潜在狄里克雷分配(LDA)模型用于对Web文档添加语义标注。考虑到Web文档具有明显的领域特征,在传统的LDA模型中嵌入领域信息,提出Domain-enable LDA模型,提高了标注结果的完整性并避免了对词汇主题的强制分配;同时在文档隐含主题和文档所在领域本体概念间建立关联,利用本体概念表达的语义对隐含主题进行准确的解释,使文档的语义清晰化,为文档检索提供有效帮助。根据LDA模型可为每个词汇分配隐含主题的特征,提出多粒度语义标注的概念。在20news-group和WebKB数据集上的实验证明了Domain-enable LDA模型的有效性,并指出对文档进行多粒度标注有助于有效处理不同类型查询。  相似文献   

6.
基于笔交互的标注工具研究   总被引:1,自引:0,他引:1  
随着电子文档的大量应用,人们需要寻找一种更加符合日常习惯的电子文档标注工具。该文介绍了一种基于笔交互的标注工具,用户可以在电子文档上使用笔进行任意标注。工具使用XML作为存储媒介,可以方便地将标注结果共享和再现。  相似文献   

7.
为了产生语义Web中的元数据,需要提取Web文档中的语义信息。面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法。语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于n-gram的语义消歧方法。采用这种方法对文档进行语义标注,将标注结果持久化为语义索引,为实现语义信息检索提供基础。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。  相似文献   

8.
通过对Internet上的模具知识特点的分析,提出了一种基于模具本体的语义标注方法,对Internet上的模具知识进行描述,并结合 实例对该方法进行了说明.该方法使用基于模具本体的向量空间模型(VSM)方法,将从页面中提取的特征词,用领域本体进行理解、扩充,然后基于改进后的TFIDF算法,求出扩充后每个特征词的权值.通过这种方法对网页文档进行语义标注后,可以把文档隐含语义信息显式地表现出来,为模具知识搜索引擎的设计提供了基础.  相似文献   

9.
在甲骨文领域本体语义环境的基础上,提出一种针对甲骨文卜辞这种特殊结构的文档进行语义标注的方法。为提高标注的准确率,分析甲骨文特有的特征,并针对这种特殊的文档提出一系列规则。该方法首先对甲骨片上的卜辞信息进行分解,然后在甲骨文本体知识的指导下进行概念抽取。对于每个具体的实例概念在本体知识库中寻找其语义环境信息。按照所提出的规则分别计算这些信息与具体一条卜辞的重要度,最后以三元组的形式把标注信息存放于标注库中。实验结果表示,该方法依据领域本体的语义环境大大提高了标注的准确率。  相似文献   

10.
互联网上存在海量数据,如何在大量的信息中查找到有用信息就变成了一个至关重要的问题。语义网为解决这一问题带来了曙光。然而当今网络现状与语义网之间存在巨大差距,即海量非结构化的页面内容难直接转化为语义的知识。提出了一种基于文档内容的语义标注方法,利用本体所表达的语义环境,即本体知识相关词汇及其所处的语义上下文环境在文档中出现频率,实现对文档的语义标注。实验显示方法取得良好的效果,但受本体知识质量和标注文档质量两个因素影响较大。  相似文献   

11.
桑成  程健  史一明 《计算机应用》2017,37(6):1728-1734
为了解决闭环全生命周期管理系统中知识相互独立、无法共享的问题,针对闭环全生命周期特点,提出了一种知识集成与语义标注方法。首先,简要阐述了闭环全生命周期管理系统中知识集成与语义标注的内涵;其次,利用本体技术对低温等离子体设备构建了多维度、多层次知识集成框架;然后,在此基础上,给出了知识文档语义标注流程,设计出一种文档语义向量与本体语义向量的提取与匹配计算方法,完成了低温等离子体设备中一个子系统的知识文档语义标注。设计测试实验并进行验证,实验结果表明,利用闭环全生命周期管理系统中的知识文档数据集进行语义标注,平均准确率达到84%,平均召回率达到79%。所提知识集成与语义标注方法可以实现知识文档在闭环全生命周期管理系统中的共享与重用。  相似文献   

12.
基于OWL的教案领域本体的建立及应用   总被引:3,自引:0,他引:3  
教案是一种重要的教育资源,是教学内容的概要,在国家教育信息化建设中起着重要的作用.在网络上如何较好地查询再利用优秀的教案资源是一个迫切需要解决的问题.语义Web技术中的本体提供了一种解决方法.本文基于本体论方法形式化地探讨教案领域本体的建立,具体介绍了如何根据教案的特点设计一个教案语义模型,并根据这个模型用OWL语言定义一些用于描述教案的本体,以及构造了一个教案语义标注的原型工具帮助用户建立OWL文档.  相似文献   

13.
针对各种邮件过滤方法的缺陷,本文提出了一种基于本体的邮件过滤方法.该方法利用对解码后邮件文档的元数据提取和本体标注,对其进行基于概率的Naive Bayes本体概念识别分类,并做出了语义解释和查询推理,从而实现了智能的邮件过滤.  相似文献   

14.
针对现有语义标注系统效率低下的现状,借鉴NCBO Annotator的思想,提出了一种基于语义的文档标注方法,旨在结合本体知识库和WordNet的语义知识,构建具有丰富语义描述能力的字典库,并利用字典库实现文档的语义标注.实验表明,本方法能够提高搜索资源的语义,进而提高搜索的准确度.此外,利用本方法还可提供语义扩展搜索.最后将字典库和标注过程以RESTful Web Service的方式呈现,极大地方便了广大用户对字典库和语义资源的使用.  相似文献   

15.
罗军  高琦  王翊 《计算机工程》2010,36(23):85-87
实现语义Web目标的一个重要前提是利用本体词汇标注Web资源。为此,提出一种基于弱监督(Bootstrapping)的本体标注方法。对给定的本体进行解析,生成规则文件,通过文本分类筛选出领域文档。采用Bootstrapping的方法进行信息标注抽取和本体推理,经过几次循环后,只利用少量的训练文本就能达到较好的标注效果。实验证明,该方法实体识别准确率高,标注效果好。  相似文献   

16.
针对大规模语料手动标注困难的问题,提出利用概率潜在语义分析(PLSA)模型的新闻评论自动标注方法.利用PLSA计算获得语料集的"文档-主题"和"词语-主题"概率矩阵;基于情感本体库和"词语-主题"概率矩阵,认为某一类情绪词汇出现的概率最高的主题与词汇的情绪类别相同,对主题进行情绪类别标注;最后,基于"文档-主题"概率矩阵,认为出现在某一主题概率最高的文档与主题的情绪类别相同,通过"词汇-主题-文档"三者的关系,达到自动标注的效果.实验结果表明,本文提出的方法准确率可达到90%以上.  相似文献   

17.
一个完整的答疑系统一般由FAQ子系统和课程文档库子系统组成.FAQ子系统用于回答常见问题,主要解决答疑速度与准确性问题;课程文档库子系统用于非常见问题的答疑,解决完整性问题.文章给出的基于课程本体的智能FAQ系统,以课程知识本体为基础,建立了课程关键词库和FAQ库;系统完全抛开庞大的通用词典,简化了分词和词性标注过程,杜绝了词语歧义现象;借助本体在知识结构及相互关系表达上的特点,在智能性和学习引导性上具有明显优势.  相似文献   

18.
一个本体语言及本体构造工具的设计   总被引:2,自引:0,他引:2  
  相似文献   

19.
提出一种面向制造业设计文档的模糊分类方法.利用领域本体的层次结构和概念间的语义关系,对设计文档进行结构划分与标注,通过特征词与概念之间的距离和位置重要性计算权重,提高了设计文档分类的准确性.  相似文献   

20.
余露 《微计算机应用》2002,23(4):231-234
本文介绍了一种利用Microsoft VisualC 工具开发的科技论文文档解析转换器的设计与实现,利用中文信息处理方法,该解析器可以快速将科技论文HTML文档转换成符合科技论文DTD规范的XML文档,实现文档从格式标注向语义标注的自动转换,从而方便科技论文的语义查询和统计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号