首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
基于规则的复句中的关系词标注探讨   总被引:2,自引:0,他引:2  
汉语中关系词的自动标注问题是自然语言理解领域的基础性研究课题。由于它的研究结果直接影响到以后的层次关系的标注、机器翻译等诸多领域的研究,加上这一问题本身具有的难度,使其很难从根本上解决。因此,也一直收到人们的普遍关注。关系词的自动标注就是通过采用适当的方法对关系词进行标注。  相似文献   

2.
关系词的自动标识是中文信息处理领域的基础性研究课题,该文利用规则实现其自动标识。首先通过语料的分析总结出关系词在使用过程中的12种特征,以这些特征建立规则的约束条件;然后提出包含匹配算法实现复句准关系词序列与规则索引词的匹配,以此获取目标规则,并根据目标规则约束条件与关系词所在语境的匹配结果得到匹配规则;最后利用匹配规则的结论实现关系词的自动标识。实验结果表明,该方法对关系词标识的正确率达到70.9%。  相似文献   

3.
基于渡越矩阵的复句关系词自动标注初探   总被引:2,自引:0,他引:2  
复句关系词的自动标注是自然语言理解领域的基础性研究课题,是层次关系标注和机器翻译等问题的研究基础。本文采用概率统计方法,建立相应的渡越矩阵研究复句关系词的自动标注方法,并进行了有效标注。标注后。对复句关系词中容易产生歧义的“结果”和“如”进行了封闭性测试和开放性测试,其准确率分别达到98.32%和96.41%,85%和83%。  相似文献   

4.
杨进才  郑雷  胡泉 《计算机与数字工程》2021,49(8):1531-1537,1618
复句关系词自动识别是复句层次识别以及对复句语义理解的基础.目前,汉语关系词的自动识别主要根据字面特征与句法特征,未涉及到语义特征的分析.论文利用哈工大的LTP平台,分析句子的语义依存关系,提取语义特征,建立语义依存特征库,运用随机森林方法自动识别复句关系词.复句关系词识别正确率92.32%,F1值为92.31%.实验结...  相似文献   

5.
关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统中规则的表示方法,为进一步研究、建设复句关系词自动识别中的规则库,深入研究规则与统计相结合自动识别复句和复句关系词的方法,为实现汉语句子和篇章的自动识别奠定基础。  相似文献   

6.
复句是汉语语法的重要实体单位,关系词的自动识别是复句标识的基础,对复句的标识以及篇章的研究有重要意义。在对汉语复句语料库进行广泛分析的基础上,从复句关系词所在的环境和关系词的组合搭配方面进行特征的提取,对提取的特征进行形式化描述。采用互信息和信息增益相结合的方式进行特征选择以及冗余特征的消除;使用贝叶斯模型对特征集合进行训练和测试;将基于统计过程的结果转化为规则,形成规则库,并根据规则进行关系词自动识别。实验结果显示,本方法获得了较高的识别正确率,具有可行性和有效性。  相似文献   

7.
目前关于关系词自动识别的研究主要集中在分词的字面特征,并未涉及语法分析。本文在基于字面特征的关系词搭配的约束条件基础上,研究基于依存关系的约束条件。利用依存语法中依存关系的五条公理分析汉语复句中关系词搭配的依存关系,从中总结出7类约束条件,并把这7类约束条件形成依存关系规则加入规则库,运用字面特征与语法特征相结合的规则自动识别汉语复句关系词。实验结果表明,对关系词的识别率可以达到90%以上。  相似文献   

8.
汉语复句关系词是汉语复句在语表形式上的标记,是复句中标识关系的重要构件,在现代汉语复句研究领域起着关键作用。汉语复句关系词的搭配是指在汉语语篇中两个或两个以上的复句关系词形成的句法共现形式,它不仅影响着分句的语义,而且影响着复句层次关系的划分。该文利用复杂网络的理论,基于已获取的470个复句关系词构建了一个“现代汉语复句关系词搭配网络”。通过对该网络中的平均路径长度、聚集系数和度分布等特征的统计,用来发现汉语复句关系词之间的搭配能力和搭配强度,这些结果能够帮助复句层次关系和复句逻辑语义的自动识别。  相似文献   

9.
关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。  相似文献   

10.
汉语文章中复句占多数,复句关系类别的识别是对复句分句之间的语义关系的甄别,是分析复句语义的关键.在关系词非充盈态复句中,部分关系词缺省,因此,不能通过关系词搭配的规则来对非充盈态复句进行类别识别,且通过人工分析分句的特征进行类别识别费时费力.本文以二句式非充盈态复句为研究对象,采用在卷积神经网络中融合关系词特征的FCNN模型,尽可能减少对语言学知识和语言规则的依赖,通过学习自动分析两个分句之间语法语义等特征,从而识别出复句的关系类别.使用本文提出的方法对复句关系类别识别准确率达97%,实验结果证明了该方法的有效性.  相似文献   

11.
加强汉语复句信息处理研究对中文信息处理具有重要意义。该文介绍了汉语复句信息工程的概况,将复句知识建模、关系标记识别、非分句识别、复句句法语义关系判定、复句知识库建设等成果条理化,结合已有成果的研究视角、方法及关注焦点来分析复句信息处理的研究现状,并对其发展趋势进行了展望。  相似文献   

12.
该文介绍了在汉语文本中抽取定义语句的方法。方法的主要特点是:给定被定义的词汇(字符串),应用Bo-yer-Moore算法查找该串在文本中的位置,继而在该句子中查找符合定义特征的谓词。在这个工作基础上,根据谓词字符串的特征排除谓词歧义,并按照句法分析的结果对定义语句修饰谓词的不同语法单元进行识别,从而实现了基于字符串和语法特征的识别的定义语句抽取。  相似文献   

13.
复句中的关系词对研究复句中各分句的语义关系有着重要意义,在基于规则的关系词自动识别中需要大量的规则,并且规则库是动态变化和不断完善的,向规则库中入库规则时会出现规则冲突和入库错误的情况,该文探讨如何在入库时识别产生冲突的规则,并对规则进行相关的处理。对复句的普通规则、连用词规则、普通句式规则、连用句式规则四类规则进行了形式化的表示与存储,在此基础上设计了关系词检测、约束类型检测、约束条件检测、结论检测的检测流程。提出了两种冲突处理方式——优先级方式和有向无环图方式,对两种方法进行了比较。利用该检测方法和有向无环图的处理方式,入库了千余条规则。实验表明,利用该方法冲突规则的检测和处理正确率达到100%。  相似文献   

14.
复句关系是指复句分句之间的逻辑语义关系,复句关系识别是对分句间语义关系的甄别,是自然语言处理中的难点问题.本文以有标复句为研究对象,提出了一种BERT-FHAN模型,该模型利用BERT模型获取词向量,在HAN模型中融入关系词本体知识以及词性、句法依存关系、语义依存关系特征.通过实验对提出的模型进行验证, BERT-FHAN模型取得的最高宏平均F1值和准确率分别为95.47%与96.97%,表明了本文方法的有效性.  相似文献   

15.
现代汉语中基本否定词“不”以及扩充词“从不”、“很不”、“不能”、“不会”等的否定辖域受到学术界重视,但前人研究一般局限于句内,且主要局限于基本否定词,其实否定辖域也涉及多个标点句,否定词的管辖判断也涉及到扩充的否定词。跨标否定词跨标点句管辖的判断和否定词共享问题是整个跨标点句句法共享问题的一个重要组成部分。本文从形式上找到了一些否定词跨标点句的共享规律,即着重从形式角度讨论了否定词跨标点句的辖域问题,对现代汉语长句句法分析有重要作用,并对汉外机器翻译有实用价值。  相似文献   

16.
复句中的关系词对研究复句中各分句的语义关系有着重要意义,但在基于规则的关系词自动识别的研究中发现,并非复句中出现的关系标记都是关系词,从中识别出真正的关系词是研究的重点和难点。提出对一种典型的关系标记——位置相邻的关系标记进行自动标记的算法,该算法结合关系词库和关系词提取技术,分析其连用特征。实验表明,该算法对连用关系标记的标识准确率达到72.9%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号