首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
基于规则的复句中的关系词标注探讨   总被引:2,自引:0,他引:2  
汉语中关系词的自动标注问题是自然语言理解领域的基础性研究课题。由于它的研究结果直接影响到以后的层次关系的标注、机器翻译等诸多领域的研究,加上这一问题本身具有的难度,使其很难从根本上解决。因此,也一直收到人们的普遍关注。关系词的自动标注就是通过采用适当的方法对关系词进行标注。  相似文献   

2.
关系词的自动标识是中文信息处理领域的基础性研究课题,该文利用规则实现其自动标识。首先通过语料的分析总结出关系词在使用过程中的12种特征,以这些特征建立规则的约束条件;然后提出包含匹配算法实现复句准关系词序列与规则索引词的匹配,以此获取目标规则,并根据目标规则约束条件与关系词所在语境的匹配结果得到匹配规则;最后利用匹配规则的结论实现关系词的自动标识。实验结果表明,该方法对关系词标识的正确率达到70.9%。  相似文献   

3.
复句是汉语语法的重要实体单位,关系词的自动识别是复句标识的基础,对复句的标识以及篇章的研究有重要意义。在对汉语复句语料库进行广泛分析的基础上,从复句关系词所在的环境和关系词的组合搭配方面进行特征的提取,对提取的特征进行形式化描述。采用互信息和信息增益相结合的方式进行特征选择以及冗余特征的消除;使用贝叶斯模型对特征集合进行训练和测试;将基于统计过程的结果转化为规则,形成规则库,并根据规则进行关系词自动识别。实验结果显示,本方法获得了较高的识别正确率,具有可行性和有效性。  相似文献   

4.
关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统中规则的表示方法,为进一步研究、建设复句关系词自动识别中的规则库,深入研究规则与统计相结合自动识别复句和复句关系词的方法,为实现汉语句子和篇章的自动识别奠定基础。  相似文献   

5.
面向中文信息处理的复句关系词提取算法研究   总被引:1,自引:1,他引:1       下载免费PDF全文
关系词语对于标明复句关系有重要的作用。在用计算机来实现汉语多重关系复句的关系层次分析的过程中,关系词语的提取和标引是首要的任务。本文针对利用计算机处理汉语复句的研究需求,结合词性标记和关系词搭配理论,提出了一种关系词提取算法——正向选择算法。通过测试可知,关系词提取的正确率达到89.88%,这表明了算法的有效性以及用于利用计算机处理汉语复句的可行性。  相似文献   

6.
基于渡越矩阵的复句关系词自动标注初探   总被引:2,自引:0,他引:2  
复句关系词的自动标注是自然语言理解领域的基础性研究课题,是层次关系标注和机器翻译等问题的研究基础。本文采用概率统计方法,建立相应的渡越矩阵研究复句关系词的自动标注方法,并进行了有效标注。标注后。对复句关系词中容易产生歧义的“结果”和“如”进行了封闭性测试和开放性测试,其准确率分别达到98.32%和96.41%,85%和83%。  相似文献   

7.
杨进才  郑雷  胡泉 《计算机与数字工程》2021,49(8):1531-1537,1618
复句关系词自动识别是复句层次识别以及对复句语义理解的基础.目前,汉语关系词的自动识别主要根据字面特征与句法特征,未涉及到语义特征的分析.论文利用哈工大的LTP平台,分析句子的语义依存关系,提取语义特征,建立语义依存特征库,运用随机森林方法自动识别复句关系词.复句关系词识别正确率92.32%,F1值为92.31%.实验结...  相似文献   

8.
杨进才  胡巧玲  胡泉 《计算机科学》2021,48(z2):124-129
汉语复句的语义表达复杂,复句关系分类问题作为汉语篇章研究与应用的重要内容,一直是自然语言处理领域关注的热点.文中总结与挖掘出复句类别自动识别的十几类字面、句法特征,将特征形式化为规则,用关系词触发规则的机制,对有标复句进行十二类关系类别的识别.实验结果表明该方法取得了较高的准确率,优于现有的方法.  相似文献   

9.
汉语文章中复句占多数,复句关系类别的识别是对复句分句之间的语义关系的甄别,是分析复句语义的关键.在关系词非充盈态复句中,部分关系词缺省,因此,不能通过关系词搭配的规则来对非充盈态复句进行类别识别,且通过人工分析分句的特征进行类别识别费时费力.本文以二句式非充盈态复句为研究对象,采用在卷积神经网络中融合关系词特征的FCNN模型,尽可能减少对语言学知识和语言规则的依赖,通过学习自动分析两个分句之间语法语义等特征,从而识别出复句的关系类别.使用本文提出的方法对复句关系类别识别准确率达97%,实验结果证明了该方法的有效性.  相似文献   

10.
目前关于关系词自动识别的研究主要集中在分词的字面特征,并未涉及语法分析。本文在基于字面特征的关系词搭配的约束条件基础上,研究基于依存关系的约束条件。利用依存语法中依存关系的五条公理分析汉语复句中关系词搭配的依存关系,从中总结出7类约束条件,并把这7类约束条件形成依存关系规则加入规则库,运用字面特征与语法特征相结合的规则自动识别汉语复句关系词。实验结果表明,对关系词的识别率可以达到90%以上。  相似文献   

11.
关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。  相似文献   

12.
加强汉语复句信息处理研究对中文信息处理具有重要意义。该文介绍了汉语复句信息工程的概况,将复句知识建模、关系标记识别、非分句识别、复句句法语义关系判定、复句知识库建设等成果条理化,结合已有成果的研究视角、方法及关注焦点来分析复句信息处理的研究现状,并对其发展趋势进行了展望。  相似文献   

13.
基于复句语料库分词系统研究   总被引:2,自引:0,他引:2  
复句在书面语中具有举足轻重的地位,如何让计算机正确理解复句是中文信息处理中一个值得重视的问题。现有的分词系统对复句关系词的正确切分与标注上不足以满足对复句进行层次分析和语义分析的需要。建立的分词系统在复句中关系词的切分和标注上做出了必要的改进。  相似文献   

14.
复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型。非充盈态汉语复句存在隐式关系的特点给语义关系识别造成了困难。为了深度挖掘复句中隐含的语义信息,正确地实现关系分类,该文提出了一种基于句内注意力机制的多路CNN网络结构Inatt-MCNN。其中句内注意力机制模型是基于Bi-LSTM的,使其能够学习到句子的双向语义特征以及分句间的关联特征。同时,为了充分利用文本特征,联合使用卷积神经网络(CNN)对复句表示再次建模获得句子局部特征。与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果相比,该文方法的宏平均F1值为85.61%,提升约6.08%,平均召回率为84.87%,提升约3.05%。  相似文献   

15.
分词系统由于未将合成词收录进词典,因此不能识别合成词。针对该问题,提出一种基于词共现有向图的中文合成词提取算法。采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜索多源点长度最长且权重值满足给定条件的路径,该路径所对应的词串即为合成词。实验结果显示,该算法的合成词提取正确率达到91.16%。  相似文献   

16.
语义相关度计算作为中文信息处理领域中的一项关键技术,在信息检索、语义消岐、文本分类中起着重要的作用。利用汉语复句的句法理论和关系标记搭配理论,以汉语复句语料库以及搜索引擎获取的复句为语料,提出了一种基于汉语复句的语义相关度计算方法——SRCCS。本方法不仅能够计算词语的相关度,而且能够表明相关的性质与类别。与通过短文计算相关度的方法相比,本方法选取的计算对象范围更小,因而结果更准确,计算复杂度更低。在同一测试集上与搜索引擎方法的对比分析证明了基于汉语复句的语义相关度计算方法的有效性与优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号