期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

苑林飞李源胡泉孙凯丽肖创业《计算机与数字工程》2021,49(12):2601-2605,2617

汉语复句的关系类型识别是对分句间语义关系的判断,是分析复句语义的关键.充盈态汉语复句虽然可以通过句中提取关系词并根据关系词的搭配规则来识别语义关系,但是需要足够的语言学相关知识并且制定大量的规则才能将其划分到正确的种类.为了避免耗费大量精力创建规则,提出了一种基于注意力机制的卷积神经网络,使用卷积神经网络自动分析三个分句之间的内在联系,进而识别出复句的关系类别.使用所提方法在充盈态有标三分复句语料库上对复句关系类型识别的准确率为94％,通过实验证明了该方法的有效性. 相似文献

2.

二句式非充盈态有标复句关系类别的自动标识

杨进才《计算机应用研究》2017,34(10)

复句关系类别的识别是对复句分句之间语义关系的甄别,是分析复句语义关系的关键。在现代汉语复句中,二句式和三句式复句占绝大多数,而三句式复句又可以拆分为二句式复句,所以多句式复句的研究归结起来就是二句式复句的研究。因此,本文以二句式非充盈态有标复句为研究对象,结合汉语复句的句法理论、关系标记搭配理论,以汉语复句语料库以及搜索引擎获取的复句为语料,进行二句式非充盈态有标复句关系类别的自动标识。使用本文提出的方法对二句式非充盈态有标复句关系类别进行自动识别,准确率达89%,实验结果证明了本文方法的有效性。相似文献

3.

多重复句关系标记搭配的求解模型研究

胡金柱雷利利杨进才舒江波陈江曼《计算机工程与科学》2011,33(11):177

关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。相似文献

4.

基于语义依存关系的汉语复句关系词自动识别

杨进才郑雷胡泉《计算机与数字工程》2021,49(8):1531-1537,1618

复句关系词自动识别是复句层次识别以及对复句语义理解的基础.目前,汉语关系词的自动识别主要根据字面特征与句法特征,未涉及到语义特征的分析.论文利用哈工大的LTP平台,分析句子的语义依存关系,提取语义特征,建立语义依存特征库,运用随机森林方法自动识别复句关系词.复句关系词识别正确率92.32％,F1值为92.31％.实验结果表明了该方法的有效性. 相似文献

5.

基于复杂网络理论的汉语复句关系词搭配网的统计特征研究

胡泉谢芳李源刘延申《中文信息学报》2016,30(4):56-64

汉语复句关系词是汉语复句在语表形式上的标记,是复句中标识关系的重要构件,在现代汉语复句研究领域起着关键作用。汉语复句关系词的搭配是指在汉语语篇中两个或两个以上的复句关系词形成的句法共现形式,它不仅影响着分句的语义,而且影响着复句层次关系的划分。该文利用复杂网络的理论,基于已获取的470个复句关系词构建了一个“现代汉语复句关系词搭配网络”。通过对该网络中的平均路径长度、聚集系数和度分布等特征的统计,用来发现汉语复句关系词之间的搭配能力和搭配强度,这些结果能够帮助复句层次关系和复句逻辑语义的自动识别。相似文献

6.

基于BERT-FHAN模型融合语句特征的汉语复句关系自动识别

杨进才曹煜欣胡泉蔡旭勋《计算机系统应用》2022,31(9):233-240

复句关系是指复句分句之间的逻辑语义关系, 复句关系识别是对分句间语义关系的甄别, 是自然语言处理中的难点问题. 本文以有标复句为研究对象, 提出了一种BERT-FHAN模型, 该模型利用BERT模型获取词向量, 在HAN模型中融入关系词本体知识以及词性、句法依存关系、语义依存关系特征. 通过实验对提出的模型进行验证, BERT-FHAN模型取得的最高宏平均F1值和准确率分别为95.47%与96.97%, 表明了本文方法的有效性. 相似文献

7.

基于规则的连用关系标记的自动标识研究

胡金柱陈江曼杨进才舒江波雷利利《计算机科学》2012,39(7):190-194

复句中的关系词对研究复句中各分句的语义关系有着重要意义,但在基于规则的关系词自动识别的研究中发现,并非复句中出现的关系标记都是关系词,从中识别出真正的关系词是研究的重点和难点。提出对一种典型的关系标记——位置相邻的关系标记进行自动标记的算法,该算法结合关系词库和关系词提取技术,分析其连用特征。实验表明,该算法对连用关系标记的标识准确率达到72.9%。相似文献

8.

复句关系词规则生成系统中的冲突检测与处理

杨进才谢芳王中华胡金柱《中文信息学报》2015,29(4):8-15

复句中的关系词对研究复句中各分句的语义关系有着重要意义,在基于规则的关系词自动识别中需要大量的规则,并且规则库是动态变化和不断完善的,向规则库中入库规则时会出现规则冲突和入库错误的情况,该文探讨如何在入库时识别产生冲突的规则,并对规则进行相关的处理。对复句的普通规则、连用词规则、普通句式规则、连用句式规则四类规则进行了形式化的表示与存储,在此基础上设计了关系词检测、约束类型检测、约束条件检测、结论检测的检测流程。提出了两种冲突处理方式——优先级方式和有向无环图方式,对两种方法进行了比较。利用该检测方法和有向无环图的处理方式,入库了千余条规则。实验表明,利用该方法冲突规则的检测和处理正确率达到100%。相似文献

9.

基于规则的有标复句关系的自动识别

杨进才胡巧玲胡泉《计算机科学》2021,48(z2):124-129

汉语复句的语义表达复杂,复句关系分类问题作为汉语篇章研究与应用的重要内容,一直是自然语言处理领域关注的热点.文中总结与挖掘出复句类别自动识别的十几类字面、句法特征,将特征形式化为规则,用关系词触发规则的机制,对有标复句进行十二类关系类别的识别.实验结果表明该方法取得了较高的准确率,优于现有的方法. 相似文献

10.

基于词聚类CNN和Bi-LSTM的汉语复句关系识别方法

孙凯丽李源邓沌华李妙李洋《计算机与数字工程》2021,49(8):1588-1593

复句关系识别是对分句间语义关系的甄别,是复句语义分析的关键.由于非充盈态汉语复句存在隐式关系的特点,给语义关系识别造成了困难.因此,为了深度挖掘复句中隐含的语义信息实现正确的关系分类,该文提出了一种基于词聚类的CNN与Bi-LSTM相结合的网络结构BCCNN.其中,通过使用词聚类算法对单词向量建模提取单词间的语义相似特征,并在此基础上使用CNN对复句进行深度建模以获得复句的局部特征.另外,该文将CNN中的池化层替换为Bi-LSTM网络层,在减少池化操作所带来语义信息丢失的同时又得到了全局的长距离语义依赖特征.与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果对比,论文的方法达到了较好的识别效果,其准确率分别达到了92.4％和90.7％. 相似文献

11.

基于DPCNN模型与语句特征融合的汉语因果类复句关系自动识别

杨进才曹元胡泉《中文信息学报》2022,36(9):19-27

汉语复句关系识别是对复句语义关系的识别,复句关系类别的自动识别对促进语言学和中文信息处理的研究有重要的价值。因果类复句是使用频率最高的复句,文中以二句式有标广义因果复句为研究对象, 使用语言技术平台LTP 进行依存句法分析, 获得词性、依存父节点的词序、与父节点的依存关系等特征,将特征的不同组合与预训练的词向量拼接,得到新的向量,将新的向量输入到 DPCNN 模型中来进行关系类别识别。通过实验对提出的方法进行检验,实验结果显示: 与未融合任何特征相比,DPCNN模型中融合语句特征使实验结果的指标均有提升,表明融合语句特征能取得更好的识别效果。在各种特征组合中,融合POS特征组合得到的准确度和F₁值最高, 分别为98.41%, 98.28%。相似文献

12.

基于VML的复句关系层次树的可视化研究* 总被引：1，自引：0，他引：1

胡金柱舒江波周星b 《计算机应用研究》2010,27(1):127-130

在现代汉语复句教学和研究中,为了分析复句的逻辑语义关系,经常需要绘制复句关系层次结构图。传统的做法是利用手工方式绘制,以图片的形式存储,但这种方式具有存储容量大、绘制工作量大的缺点。采用VML技术,在标注复句的基础上,研究了复句关系层次树的自动生成方法以及复句关系层次树在网页中的可视化。通过对不同类型复句进行试验,结果表明各种类型的复句均能准确显示。这就表明该可视化方法能够有效地应用到复句信息工程的研究中。相似文献

13.

基于句内注意力机制多路CNN的汉语复句关系识别方法

孙凯丽邓沌华李源李妙李洋《中文信息学报》2020,34(6):9

复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型。非充盈态汉语复句存在隐式关系的特点给语义关系识别造成了困难。为了深度挖掘复句中隐含的语义信息,正确地实现关系分类,该文提出了一种基于句内注意力机制的多路CNN网络结构Inatt-MCNN。其中句内注意力机制模型是基于Bi-LSTM的,使其能够学习到句子的双向语义特征以及分句间的关联特征。同时,为了充分利用文本特征,联合使用卷积神经网络(CNN)对复句表示再次建模获得句子局部特征。与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果相比,该文方法的宏平均F₁值为85.61%,提升约6.08%,平均召回率为84.87%,提升约3.05%。相似文献

14.

基于关系向量模型的句子相似度计算

殷耀明张东站《计算机工程与应用》2014,50(2):198-203

句子相似度的计算在自然语言处理的各个领域占有很重要的地位,一些传统的计算方法只考虑句子的词形、句长、词序等表面信息,并没有考虑句子更深层次的语义信息,另一些考虑句子语义的方法在实用性上的表现不太理想。在空间向量模型的基础上提出了一种同时考虑句子结构和语义信息的关系向量模型,这种模型考虑了组成句子的关键词之间的搭配关系和关键词的同义信息,这些信息反应了句子的局部结构成分以及各局部之间的关联关系,因此更能体现句子的结构和语义信息。以关系向量模型为核心,提出了基于关系向量模型的句子相似度计算方法。同时将该算法应用到网络热点新闻自动摘要生成算法中,排除文摘中意思相近的句子从而避免文摘的冗余。实验结果表明,在考虑网络新闻中的句子相似度时,与考虑词序与语义的算法相比,关系向量模型算法不但提高了句子相似度计算的准确率,计算的时间复杂度也得到了降低。相似文献

15.

复句关系词自动识别中规则的表示方法研究

胡金柱舒江波胡泉李源杨进才谢芳《计算机工程与应用》2016,52(1):127-132

关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统中规则的表示方法,为进一步研究、建设复句关系词自动识别中的规则库,深入研究规则与统计相结合自动识别复句和复句关系词的方法,为实现汉语句子和篇章的自动识别奠定基础。相似文献

16.

汉英机器翻译中描述型复句的关系识别与处理 总被引：5，自引：0，他引：5

鲁松宋柔《软件学报》2001,12(1):83-93

汉英机器翻译的复句处理不仅要依托于单句的处理,而且还要超越单句的辖域,深入考察复句内分句之间的内在联系.其中,在汉语描述型复句中存在着大量的无特定语言标记的非并列关系复句,为了辨别其中的内在联系,实现英语译文的正确生成,针对不同情况,给出了完整的关系判定规则,并提出采用中心分句动态判定方法来解决部分复句处理规则局部性的问题,最后通过实验系统得以验证. 相似文献