首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。  相似文献   

2.
语料库作为基本的语言数据库和知识库,是各种自然语言处理方法实现的基础。随着统计方法在自然语言处理中的广泛应用,语料库建设已成为重要的研究课题。自动分词是句法分析的一项不可或缺的基础性工作,其性能直接影响句法分析。本文通过对85万字节藏语语料的统计分析和藏语词的分布特点、语法功能研究,介绍基于词典库的藏文自动分词系统的模型,给出了切分用词典库的结构、格分块算法和还原算法。系统的研制为藏文输入法研究、藏文电子词典建设、藏文字词频统计、搜索引擎的设计和实现、机器翻译系统的开发、网络信息安全、藏文语料库建设以及藏语语义分析研究奠定了基础。  相似文献   

3.
双语语料对齐是自然语言处理的一个重要研究课题。对双语平行语料库的研究工作主要有构建、对齐和标注等方面,其中研究不同级别的对齐技术是一个重要的中心课题,对齐不仅是进一步利用平行语料库获取一些语言知识的必要前提.也是机器翻译系统利用双语知识的重要前期处理。重点介绍典型的句子对齐方法,并总结出每种方法的优缺点,具体分析了汉维双语句子对齐的方法。  相似文献   

4.
语料库与知识获取模型   总被引:1,自引:0,他引:1  
在计算语言学中, 知识作为句法分析的数据支持起着重要的作用, 如何利用计算机从现实世界中获取知识一直是人工智能领域探讨的重要课题, 本文描述了如何从语料库这一客观真实数据资料获取有用知识, 用以帮助汉语句子中依存关系的分析, 在依存语法作为语言模型的基础上, 探讨了向上依存关系的二元同现矩阵, 以及知识库的组成和结构, 在获取词跟词之间的依存关系的同时, 还获取了词跟类、类跟类之间的依存关系  相似文献   

5.
基于视频三音子的汉语双模态语料库的建立   总被引:2,自引:0,他引:2  
为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中唇部发音特征,对已有的三音子模型聚类,形成视频三音子。在视频三音子的基础上,利用评估函数对原始语料中的句子打分,并实现语料的自动选取。与其他双模态语料库相比,该文所建立的语料库在覆盖率、覆盖效率和高频词分布律有了较大改进,能够更加真实反映汉语中的双模态语言现象。  相似文献   

6.
朱峰  顾敏  郑好  顾彦慧  周俊生  曲维光 《计算机科学》2017,44(1):95-99, 127
传统的应用于未登录词语义研究的语料库包含许多限制,例如更新慢、语言相关等。为了解决此问题,提出了基于知识图谱的中文未登录词语义研究方法。知识图谱是一种包含实体、概念及语义关系的语义网络。它具有丰富的实体,并且实体及其关系的添加极为方便,使得弥补传统语料库更新慢的缺憾成为可能。在充分熟悉知识图谱的结构、数据获取方法及相关数据处理方法后,进行基于知识图谱的未登录词语义研究的探索工作,最后以百度百科(目前最大的中文知识图谱)为语料资源,在同一语义分析模型下分别进行基于知识图谱与传统语料的实验,对实验结果进行分析并提出改进方法。  相似文献   

7.
余蕾  曹存根 《计算机科学》2007,34(2):161-165
互联网网页中存在大量的专业知识。如何从这些资源中获取知识已经成为10多年来的一个重要的研究课题。概念和概念间的关系是知识的基本组成部分,因此如何获取并验证概念,成为从文本到知识的过程中的重要步骤。本文提出并实现了一种自动从Web语料中获取概念的方法,该方法利用了规则、统计、上下文信息等多种方法和信息。实验结果表明,该方法达到了较好的效果。  相似文献   

8.
2010年4月18至19日,在乐山师范学院召开了"超大规模语料库精深加工及应用研讨会".会议中心议题是交流在超大规模语料获取、整理、加工方面的成果与经验,特别针对基于国家语言资源监测语料库的语言状况调查中遇到的问题进行了深入讨论.  相似文献   

9.
基于小规模语料库和机器可读词典的二元分布语义获取   总被引:1,自引:1,他引:1  
本文提出了一种基于小规模语料库和机器可读词典(Machine Readable Dictionary ,MRD)的无指导的动词语义获取方法。该方法不需要使用有义项标注的语料库,而是使用从语料中获得的V+N搭配以及MRD中多义词定义的应用实例中获得的知识。使用两种方法解决数据稀疏问题:首先,将词的相似性度量由直接共现扩展到共现词的共现,以共现聚类而不是共现词来计算词的相似度。其次,从MRD定义中获取名词的IS- A关系。通过这些方法,即使两个词不共享任何词,也可认为是相似的。实验表明,该方法可从很小规模的语料中获取知识,并在不限制词义的情况下达到85.7%的正确排歧率。  相似文献   

10.
针对互联网上日渐丰富的多语言文本和匮乏大规模标注平行语料库的问题,为了从多语言的信息源挖掘语言间的关联性与扩展知识图谱,提出了基于注意力迁移的跨语言关系提取方法。首先针对语言间的实际平行语料情况,分类进行跨语言平行语料映射,并针对缺乏种子词典的低资源语言对,提出神经网络翻译模型获取目标语言数据集并保存多语言间的对应注意力权重关系,然后利用BERT端对端的联合抽取模型抽取训练数据实体关系特征,反向迁移语言间注意力权重关系,最后利用反向迁移的注意力进行增强的关系抽取。实验表明,该模型的关系提取效果相比其他模型在准确率和回归上都有所提升,在缺乏双语词典情况下也表现出较好的性能。  相似文献   

11.
知识管理与知识共享   总被引:3,自引:0,他引:3  
现在的人类社会,知识无处不在,无处不用。越来越多的企业意识到人与知识是企业竞争力的根本,于是,“以人为本”成了许多企业文化的核心,“知识资本”和“知本家”体现出入门对知识价值的认同。根据报道,财富1000中近半数的企业设立了知识主管,负责为知识共享创建基础设施和文化环境,为实施知识管理创造条件。不仅工业界,学术界也对知识管理倍加关注。本文介绍知识管理与知识共享的概念,关键技术及其应用,对相关问题进行分析和探讨。  相似文献   

12.
服装知识在服装知识查询系统、计算机辅助服装工艺设计和服装智能教学系统等高技术产品中具有重要的作用,因此有必要建立一个健壮、协调、具有良好联通性的服装知识库,以便为用户/服装设计师提供更为便捷和良好的知识服务。为此,论文提出了一种基于知识本体的服装知识获取方法,设计了较为完善的服装概念本体体系。另外,提出了知识联通的方法,以解决不同的知识源之间存在的如下问题一是知识的不一致性,二是知识粒度(Granularity)不同,三是知识的精度不同,以尽可能保证所获取知识的一致性、完备性和精确性。  相似文献   

13.
Gruber  Thomas R. 《Machine Learning》1989,4(3-4):293-336
Strategic knowledge is used by an agent to decide what action to perform next, where actions have consequences external to the agent. This article presents a computer-mediated method for acquiring strategic knowledge. The general knowledge acquisition problem and the special difficulties of acquiring strategic knowledge are analyzed in terms of representation mismatch: the difference between the form in which knowledge is available from the world and the form required for knowledge systems. ASK is an interactive knowledge acquisition tool that elicits strategic knowledge from people in the form of justifications for action choices and generates strategy rules that operationalize and generalize the expert's advice. The basic approach is demonstrated with a human–computer dialog in which ASK acquires strategic knowledge for medical diagnosis and treatment. The rationale for and consequences of specific design decisions in ASK are analyzed, and the scope of applicability and limitations of the approach are assessed. The paper concludes by discussing the contribution of knowledge representation to automated knowledge acquisition.  相似文献   

14.
知识管理中的基于XML的知识存储*   总被引:4,自引:0,他引:4  
在研究和分析了四种XML存储方式各自特点的基础上,针对Native-XML数据库,提出了基于模式语义块的XML页-记录存储方法。  相似文献   

15.
知识管理系统中的知识推送   总被引:13,自引:0,他引:13  
首先为信息体建立元知识,构造出知识项;然后利用OML对规范化术语予以定义,并构造出概念网络,进而建立包含核心网络和同义网络的语义网络.以此为基础,并借助于用户视图中的元知识,通过构造匹配函数来确定推送对象,实现了知识的准确推送.  相似文献   

16.
知识管理与知识管理系统   总被引:2,自引:1,他引:2  
胡国忠 《现代计算机》2005,19(12):50-53
知识管理系统是目前一门较为新兴的学科.本文着重介绍了知识管理的概念及其在企业中所发挥的作用,对系统的体系结构、功能模块、系统管理等进行了初步探讨,对知识管理的过程和目前知识管理的相关技术进行了说明,并对知识管理系统的发展提出了几点初步的设想.  相似文献   

17.
基于XML的知识融合与知识库组织   总被引:15,自引:0,他引:15  
提出了一种基于XML的知识表示方法—XKR(XML-based Knowlodge Rcpresentation)。XKR把产生式、框架、语义网络,过程表示法等多种传统的表示方法融合到一起,用XML作统一的形式描述语言。由于XML本身包含语义并能够无限扩充,因此XKR可以描述不同背景不同类型的知识,实验知识融合。在此基础上,进一步构建出分布式知识库。  相似文献   

18.
随着智能化水平的不断提高,每时每刻都有大量的新知识产生,知识图谱逐渐成为我们管理知识的工具之一.但现有的知识图谱仍然存在属性缺失、关系稀疏等问题,同时还存在大量噪声信息,导致图谱质量不佳,易对自然语言处理领域中的各类任务造成影响.面向知识图谱的知识推理技术作为目前的研究热点,是解决该问题的主要方法,其通过模拟人的推理过程完成对图谱信息的完善,在众多应用中有较好表现.以知识图谱为切入点,将知识推理技术按类别划分并分别阐释,详细分析该技术的几种应用任务,例如智能问答、推荐系统等,最后对未来主要研究方向进行展望,提出几种研究思路.  相似文献   

19.
基于RuleML的多级知识单元知识表示方法   总被引:4,自引:0,他引:4  
文章针对农业领域的知识表示问题探讨了一种基于RuleML格式的多级知识单元的知识表示方法。RuleML和多级知识单元的有机结合使得知识预处理的效率获得提高,并体现出数据库和知识库融合的一定优势,还实现了知识表示的标准化、规范化和通用化。  相似文献   

20.
分析描述逻辑和本体论语义,提出知识元本体论点,并用Web本体语言OWL详细地构建了知识元本体的初步版本.提出基于知识元本体的知识表示方法.从而为构建具有更小知识单元共享粒度和知识语义推理的知识库系统提供统一的知识元本体定义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号