首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
皮乾东  邵玉斌  龙华  杨陈菊 《控制工程》2021,28(12):2318-2322
为改进传统的汉语句法分析算法,采用自顶向下、逆向扫描的分析方法,结合汉语语序的重要特性,提出了一种改进自左向右(left to right,LR)分析算法的汉语层次化句法分析器设计方法.该分析器仅基于当前经验得出十几条汉语语序特征,不断逆向扫描语句,结合上下文无关文法和汉语语序规则进行移进-归约处理,进而得到汉语层...  相似文献   

2.
面向特定领域的汉语句法主干分析   总被引:3,自引:3,他引:3  
本文提出了一种面向特定领域的汉语句法主干分析方法。该方法中包括浅层句法分析、模板匹配两个关键环节,形成用模板表示的句法主干。在浅层句法分析中,本文使用了级联的隐马尔可夫模型进行了短语的归并;而后以已有的汉语句子模板为基础,进行模板匹配以达到句法主干分析的目标。在针对体育新闻领域语料的开放测试中,模板匹配的精确率和召回率分别达到了98.04%和81.43% ,句子级的精确率和召回率分别达到了96.97%、84.85% ,实验表明该方法在特定领域是有效的。  相似文献   

3.
目前,大部分句法分析都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出规则分层的方法,将标点融入汉语句法分析中。利用标点符号的分割作用,将长句分成一个个小的句子的序列,并对每个小的句子单元进行句法和结构分析,再根据已经抽取出来的类型规则进行二次句法分析,从而得到一个完整的句法分析树。实验表明,这种方法不但解决了部分长句无法正确得到句法树的难题,而且分析的歧义减小了,效率得到了提高。  相似文献   

4.
本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用Inside-Outside算法进行迭代,最后提出了一个基于统计模型的自顶向下的汉语句法分析器。在封闭测试下,其标记精确率和标记召回率分别为88.1%和86.8%。实验结果表明,这种方法确实能够提高标记的精确率和召回率,值得深入研究。  相似文献   

5.
本文提出了一种简单有效的词义消歧方法,该模型充分利用依存文法分析,从句子的内部结构,寻找词语之间支配与被支配的关系,借以确定能够对词语语义构成内在限制的词语。借助《知网》系统的实体关系,并结合与该岐义词相关联词语的义项,计算歧义词的义项权重,从而根据义项权重大小来判断歧义词的词义。  相似文献   

6.
融合丰富语言知识的汉语统计句法分析   总被引:1,自引:0,他引:1  
知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外。树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中。我们的汉语统计句法分析模型从3 个方面融合潜在的丰富语言知识:1) 重新标注树库中的非递归名词短语和非递归动词短语;2) 设计新的中心词映射表;3) 引进上下文配置框架以更具体地描述二元依存结构。由于融合了以上三种潜在语言知识,模型的F1 值提高了2137 % ,完全匹配正确率提高了5136 %。  相似文献   

7.
在布料动态模拟仿真过程中,收敛速度和模拟效率是两个核心指标,可以很好的反应布料在动态过程中的模拟效果。针对布料动态模拟中的收敛速度慢、模拟效率低的问题,提出了一种基于规则网格的层次化模拟方法,实现了基于位置的层次化动态模拟。在该方法中,利用层次化思想在原始网格的基础上构建层次化约束网格,在这个过程中,可以采用不同的决策函数对网格进行精简,构造出更加满足目标要求的约束网格,在构造完成后利用提出的权值关联模型对各层次进行再矫正。在模拟过程中,原始网格利用层次化约束网格从最粗层到最精细层进行收敛矫正,有效避免了传统为提高收敛速度而单一的增加约束矫正迭代次数的问题。为了检验模拟性能,布料在周期钟摆风场下进行了实验。实验表明,在基于规则网格的层次化方法模拟下,能很好的解决传统模拟的约束震荡问题,并且效率高,稳定性好。  相似文献   

8.
基于人工神经网络的汉语兼类处理方法的研究   总被引:7,自引:0,他引:7  
汉语兼类处理是计算机理解汉语的一个关键技术.目前广泛研究和应用的兼类处理方法大多是基于规则的.但实践表明规则处理系统在用于汉语兼类处理时效果并不尽如人意.文中首次将人工神经网络方法引入汉语兼类处理领域,选择确定了汉语兼类处理的神经网络的结构、输入信息和算法.在经过训练后,基于人工神经网络的汉语兼类处理系统在处理能力和效率上都显著超过了规则处理系统.  相似文献   

9.
武器系统的层次化、组合化建模方法   总被引:1,自引:0,他引:1  
由于传统的武器系统仿真建模方法受到所使用理论的局限,无法满足武器系统层次化、组合化建模的要求,因此武器系统乃至装备体系的层次化、模块化、组合化建模研究,已成为武器系统建模与仿真研究的热点问题之一.该文在消化吸收美国Arizona大学Zeigler教授创立的建模与仿真理论成果的基础上,分析了系统分类的层次,给出了不同层次系统结构的一般表述,归纳了系统的原子模型和耦合模型的形式化描述,以及相互间的依存关系.给出了一个用于武器系统层次化、组合化建模的框架和思路.初步应用尝试表明,该方法有着较好的应用前景.  相似文献   

10.
为提高电子设备电磁兼容预测的准确性和抗干扰能力,提出基于部分元等效电路(PEEC)的电磁兼容性层次化预测方法.构建电子设备电磁信号模型,波束聚焦和模糊识别电磁信号后对其进行调制.利用空间波束形成处理方法对调制后的电磁信号进行兼容性融合和滤波处理,提取电磁信号的谱特征.采用PEEC参数估计方法结合谱特征结果多层次预测电子...  相似文献   

11.
层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分析中错误累积问题尤为严重,该文提出了一种简单可行的错误预判及协同纠错算法,跟踪本层预判的错误标注结果进入下一层,利用两层预测分数相结合的方式协同纠错。实验结果表明,加入纠错方法后,层次句法分析在保证解析速度的同时,获得了与主流中文句法分析器相当的解析精度。  相似文献   

12.
蒋志鹏  关毅 《自动化学报》2019,45(2):276-288
完全句法分析是自然语言处理(Natural language processing,NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record,CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病历模式化强的子语言特征,首次以树片段形式化中文电子病历复用的模式,提出了面向数据句法分析(Data-oriented parsing,DOP)和层次句法分析融合模型.在树片段抽取阶段,提出效率更高的标准树片段和局部树片段抽取算法,分别解决了标准树片段的重复比对问题,以及二次树核(Quadratic tree kernel,QTK)的效率低下问题,获得了标准树片段集和局部树片段集.基于上述两个树片段集,提出词汇和词性混合匹配策略和最大化树片段组合算法改进面向数据句法分析模型,缓解了无效树片段带来的噪声.实验结果表明,该融合模型能够有效改善中文电子病历句法分析效果,基于少量标注语料F1值能够达到目前最高的80.87%,并且在跨科室句法分析上超过Stanford parser和Berkeley parser 2%以上.  相似文献   

13.
基于标点符号分割的汉语句法分析算法   总被引:6,自引:0,他引:6  
目前大部分句法解析器都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出单独解析块的概念,并且根据标点符号在句子中的特有特征和位置关系,给出了基于决策树算法(Id3)单独解析块识别方法,将标点融入汉语句法分析中。本文所用的实验数据(包括训练集和测试集)均来自中文宾州树库5.0。对句长大于40个词的汉语长句单独进行了实验,句法分析精度和召回率分别提高1.59%和0.93%,同时时间开销降低了近2/3。实验结果表明,标点对汉语长句句法分析非常有利, 系统性能获得了较大提高。  相似文献   

14.
Dependency parsers, which are widely used in natural language processing tasks, employ a representation of syntax in which the structure of sentences is expressed in the form of directed links (dependencies) between their words. In this article, we introduce a new approach to transition‐based dependency parsing in which the parsing algorithm does not directly construct dependencies, but rather undirected links, which are then assigned a direction in a postprocessing step. We show that this alleviates error propagation, because undirected parsers do not need to observe the single‐head constraint, resulting in better accuracy. Undirected parsers can be obtained by transforming existing directed transition‐based parsers as long as they satisfy certain conditions. We apply this approach to obtain undirected variants of three different parsers (the Planar, 2‐Planar, and Covington algorithms) and perform experiments on several data sets from the CoNLL‐X shared tasks and on the Wall Street Journal portion of the Penn Treebank, showing that our approach is successful in reducing error propagation and produces improvements in parsing accuracy in most of the cases and achieving results competitive with state‐of‐the‐art transition‐based parsers.  相似文献   

15.
在长距离依赖场景,篇章依存分析的效果欠佳,传统分析方法通常设计大量特征模板来缓解这一瓶颈问题.该文提出一种层次化篇章依存分析方法,减少了篇章分析器所需一次性处理的篇章分析单元的数量,从而缩短了分析器所处理的依存对之间的距离;并通过长短时记忆模型直接处理篇章分析单元中的序列信息,避免了特征提取.在RS T语料库上进行实验...  相似文献   

16.
基于移进归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数据改进移进归约句法分析系统,使之尽可能接近伯克利句法分析器的性能。我们首先应用伯克利句法分析器对大规模的无标注数据进行自动分析,然后利用得到的自动标注数据作为额外的训练数据改进词性标注系统和移进归约句法分析器。实验结果表明,向上学习方法和无标注数据使移进归约句法分析的性能提高了2.3%,达到82.4%。这个性能与伯克利句法分析器的性能可比。与此同时,该文最终得到的句法分析系统拥有明显的速度优势(7倍速度于伯克利句法分析器)。  相似文献   

17.
基于局部优先的汉语句法分析方法*   总被引:24,自引:1,他引:24  
提出了一种利用局部优先信息对汉语分析算法进行优化的新方法,通过利用从语料库中自动获取的结构优先关系数据作为优先判断依据.此方法使目前的汉语概率分析器的整体效率提高了近30%,显示了很好的应用前景.  相似文献   

18.
基于动作建模的中文依存句法分析   总被引:1,自引:0,他引:1  
决策式依存句法分析,也就是基于分析动作的句法分析方法,常常被认为是一种高效的分析算法,但是它的性能稍低于一些更复杂的句法分析模型。本文将决策式句法分析同产生式、判别式句法分析这些复杂模型做了比较,试验数据采用宾州中文树库。结果显示,对于中文依存句法分析,决策式句法分析在性能上好于产生式和判别式句法分析。更进一步,我们观察到决策式句法分析是一种贪婪的算法,它在每个分析步骤只挑选最有可能的分析动作而丢失了对整句话依存分析的全局视角。基于此,我们提出了两种模型用来对句法分析动作进行建模以避免原决策式依存分析方法的贪婪性。试验结果显示,基于动作建模的依存分析模型在性能上好于原决策式依存分析方法,同时保持了较低的时间复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号