期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于GLR算法的维吾尔语句法分析研究

朱敬国吐尔根·依布拉音张路任宏宇《现代计算机》2011,(8):19-22

采用GLR算法对维吾尔语句子进行句法分析,并且与平行LR算法进行比较,比较它们的分析过程,针对于维吾尔语在单词集上进行句法分析。分析结果采用最优规则,选取最优的句法分析树,对下一步的句法分析研究提供很大的帮助。相似文献

2.

维吾尔语KP短语的句法分析研究

阿力木江·托乎提《计算机应用与软件》2010,27(11)

维吾尔语句法分析是维吾尔文信息处理领域一个重要的基础性课题,同时也是一个公认的难题,在机器翻译、文本相似文献

3.

自然语言句法分析的顺序控制算法 总被引：1，自引：0，他引：1

宋柔王鑫《软件学报》1992,3(2):15-20

自然语言处理系统的运行速度对于系统本身的开发是至关重要的。这类系统的核心之一是句法分析子系统,本文讨论句法分析的一般性的顺序控制算法,包括简单回溯算法、彻底回溯及其剪裁的算法,以及算法的实现方法,实验和分析表明,这些算法的效率是相当令人满意的。相似文献

4.

基于神经网络的GLR句法分析算法

赵亚琴周献中《计算机应用》2005,25(6):1339-1341,1344

提出并实现了一种基于神经网络的GLR(Generalized LR)句法分析算法,该算法结合神经网络自学习、自组织和并行分布处理等优点,以BP神经网络结构模型取代了GLR算法的分析表,模拟其移进和归约动作,通过计算网络输出来分析句法结构。该分析算法较好地解决了GLR算法对于存在多个移进归约冲突动作时,复制分析栈会使得动作表变得很大的缺点,实验结果表明,这种算法具有较好的泛化能力。相似文献

5.

基于期待类型的Chart句法分析算法 总被引：1，自引：0，他引：1

王牋李中志《计算机应用》2009,29(5):1251-1253

Chart算法是目前句法分析中应用最广泛的算法之一,但该算法的计算效率仍有待提高。通过对两种常用Chart算法的分析,提出一种以由底向上的Chart算法为基础,结合自顶向下Chart算法的预测能力的算法。算法按严格从左到右、由底向上的方向进行,根据已有活动边的活动角色类型和句法规则,产生当前词位置上的期待类型表,并以此限制后续边的生成。对比实验的结果表明,分析速度较普通Chart算法提高了约24%,同时也减少了一半以上因边池溢出而导致的分析失败的语句。相似文献

6.

头驱动句法分析中的直接插值平滑算法 总被引：3，自引：0，他引：3

刘水李生赵铁军刘鹏远《软件学报》2009,20(11):2915-2924

在头驱动句法分析模型下,基于经典插值平滑算法,提出了以统计空间中平均事件数为基础的直接插值平滑建模原则,并应用经典的误差理论分析了该原则的合理性.基于该原则并借鉴语言模型中其他插值平滑算法对模型的零点进行假设的方法,在头驱动句法分析模型下,重新构造了4种平滑算法.实验数据显示,新平滑算法在高于经典平滑算法性能的同时,显著降低了自由参数的扰动程度,从实验的角度证明了该平滑建模原则的有效性. 相似文献

7.

基于语法功能匹配的汉语句法分析算法

卢俊之陈小荷王东波陈锋《计算机工程与应用》2008,44(16):151-153

以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,短语正确率与召回率在封闭测试和开放测试中分别达到75.17%、73.69%和65.06%、56.55%。相似文献

8.

基于统计的句法分析技术综述

孟遥李生赵铁军杨沐昀《计算机科学》2003,30(9):54-58

Parsing is a fundamental problem in natural language processing. This paper presents a critical overview of the state-of-the-art in statistical parsing technology, including the primary statistical theory, statistical models and the parsing evaluation. At last we give our point on the statistical parsing direction. 相似文献

9.

基于两种句法分析的语义角色标注比较研究 总被引：1，自引：0，他引：1

张育王红玲周国栋《计算机应用与软件》2010,27(8)

首先介绍了短语结构句法树和依存树,比较了两者的差别.然后通过构建基于短语结构句法分析和基于依存句法分析的两个不同的语义角色标注系统,在实验数据的基础上,重点分析短语结构句法分析和依存句法分析的差别以及两者对语义角色标注的影响.实验结果表明,基于依存句法分析的语义角色标注系统的性能略好于基于短语结构句法分析的语义角色标注系统. 相似文献

10.

一种有效的汉语概率句法分析算法

陈晓辉周源远袁春风武港山《计算机应用研究》2006,23(1):141-143

一种有效的汉语概率句法分析算法通过制定语法功能词表和包含语法功能词的概率上下文无关规则集进行句法分析。它以语法功能词为切入点,首先识别出所有包含语法功能词的短语,然后分析短语之间的组合关系,最终得到句法树。实验表明该算法能获得较高的准确率。相似文献

11.

基于规则的汉语句法分析方法研究 总被引：4，自引：1，他引：4

王鹏戴新宇陈家骏王启祥《计算机工程与应用》2003,39(29):63-66,169

该文从汉语的句法结构特点出发对基于规则的汉语句法分析方法进行讨论,从中总结出这类方法的一般特征,提出实用化的基于规则的汉语句法分析器必须引入其它辅助分析手段才能提高性能和可靠性。相似文献

12.

基于最大熵模型的组块分析 总被引：39，自引：0，他引：39

李素建刘群杨志峰《计算机学报》2003,26(12):1722-1727

采用最大熵模型实现中文组块分析的任务．首先明确了中文组块的定义，并且列出了模型中所有的组块类型和组块标注符号．组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程，我们可以把它作为一个分类问题根据最大熵模型来解决．最大熵模型的关键是如何选取有效的特征，文中给出了相关的特征选择过程和算法．最后给出了系统实现和实验结果．相似文献

13.

面向数据的句法分析技术 总被引：7，自引：1，他引：7

朱靖波姚天顺《中文信息学报》1998,12(1):2-9

面向数据的分析技术(Data-Oriented Parsing ,DOP) 首先由Scha (1990) 年提出。该处理技术具体表达了这样的假设:人类对语言的领悟和创造依赖于以往具体的语言经验,而不是依赖于抽象的语法规则。DOP 技术框架可以分为: (1) 建立包括以往成功分析的语言经验的标注语料库; (2) 从语料库中抽取片段单元来构造新语言的分析过程;(3) 计算分析过程的概率。DOP 模型建立在包含大量语言现象的语料库基础上,把经过标注的语料库看作一个语法( Grammar) 。当输入一个新的语言现象时,系统通过对语料库中片段单元的组合运算来组合分析过程。根据所有片段单元的共现频率来评估最有可能性的分析结果。本文详细论述了语料库的标注,片段单元的定义,组合分析和概率计算。相似文献

14.

Improving Syntactic Parsing of Chinese with Empty Element Recovery

下载免费PDF全文

周国栋李培峰《计算机科学技术学报》2013,28(6):1106-1116

This paper puts forward and explores the problem of empty element （EE） recovery in Chinese from the syntactic parsing perspective, which has been largely ignored in the literature. First, we demonstrate why EEs play a critical role in syntactic parsing of Chinese and how EEs can better benefit syntactic parsing of Chinese via re-categorization from the syntactic perspective. Then, we propose two ways to automatically recover EEs： a joint constituent parsing approach and a chunk-based dependency parsing approach. Evaluation on the Chinese TreeBank （CTB） 5.1 corpus shows that integrating EE recovery into the Charniak parser achieves a significant performance improvement of 1.29 in Fl-measure. To the best of our knowledge, this is the first close examination of EEs in syntactic parsing of Chinese, which deserves more attention in the future with regard to its specific importance. 相似文献

15.

汉语概念复合块的自动分析

仵永栩吕学强周强关晓炟《中文信息学报》2016,30(2):1-11

为解决句法分析任务中的块边界识别和块内结构分析问题,该文基于概念复合块描述体系进行了块分析探索。通过概念复合块与以往的基本块和功能块描述体系的对比分析,深入挖掘了概念复合块自动分析的主要难点所在,提出了一种基于“移进-归约”模型的汉语概念复合块自动分析方法。在从清华句法树库TCT中自动提取的概念复合块标注库上,多层次、多角度对概念复合块自动分析性能进行了纵向与横向评估,初步实验结果证明了该分析方法对简单概念复合块分析的有效性,为后续进行更复杂的概念复合块的句法语义分析研究打下了很好的基础。相似文献

16.

汉语句法分析中标点符号的运用

下载免费PDF全文

张小艳邵刚史月飞《计算机工程与科学》2009,31(1)

目前,大部分句法分析都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出规则分层的方法,将标点融入汉语句法分析中。利用标点符号的分割作用,将长句分成一个个小的句子的序列,并对每个小的句子单元进行句法和结构分析,再根据已经抽取出来的类型规则进行二次句法分析,从而得到一个完整的句法分析树。实验表明,这种方法不但解决了部分长句无法正确得到句法树的难题,而且分析的歧义减小了,效率得到了提高。相似文献

17.

向上学习方法改进移进归约中文句法分析

朱慕华王会珍朱靖波《中文信息学报》2015,29(2):33-39

基于移进归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数据改进移进归约句法分析系统,使之尽可能接近伯克利句法分析器的性能。我们首先应用伯克利句法分析器对大规模的无标注数据进行自动分析,然后利用得到的自动标注数据作为额外的训练数据改进词性标注系统和移进归约句法分析器。实验结果表明,向上学习方法和无标注数据使移进归约句法分析的性能提高了2.3%,达到82.4%。这个性能与伯克利句法分析器的性能可比。与此同时,该文最终得到的句法分析系统拥有明显的速度优势(7倍速度于伯克利句法分析器)。相似文献

18.

统计与规则相结合的维吾尔语人名识别方法 总被引：1，自引：0，他引：1

塔什甫拉提&# 尼扎木丁汪昆艾斯卡尔&# 艾木都拉帕力旦&# 吐尔逊《自动化学报》2017,43(4):653-664

命名实体识别（Named entity recognition,NER）是自然语言处理（Natural language processing,NLP）中重要的任务,其中人名实体是主要的识别对象之一.本文从维吾尔语黏着性特点出发,从词干、音节、字符串三个角度对维吾尔语单词进行拆分,获得更小的语言单元,并把切分的新单元作为特征加入到条件随机场（Conditional random field,CRF）中,明显缓解了数据稀疏的影响,取得了比以单词为基本单元的人名识别方法更好的性能.同时还从维吾尔语中汉族人名的特点出发,提出了基于规则的维吾尔语中汉族人名的识别方法,最终利用统计和规则相结合的方法进一步提高了识别的准确率.实验结果表明,该方法人名识别的准确率、召回率和F1值分别达到了87.47%、89.12%和88.29%. 相似文献

19.

维吾尔语词法中音变现象的自动还原模型

麦热哈巴·艾力姜文斌吐尔根·依布拉音《中文信息学报》2012,26(1):91-97

该文针对维吾尔语的音变现象,提出了一种自动还原模型。与以往方法不同的是,此模型中我们把音变现象泛化,先假设维吾尔语中所有语音都有音变现象,从而将还原问题转化为类似于词性标注问题,再利用标注的方法解决了还原操作。在新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上做了实验,还原模块作为维吾尔语词法分析器的一部分,把词法分析器功能的F值从84.1%提高到了91.4%,同时维吾尔语中词缀数目最多、变形情况最复杂的动词词干的还原正确率也达到了88.6%,实际应用中完全可以被接受。相似文献

20.

结合结构下文及词汇信息的汉语句法分析方法 总被引：2，自引：0，他引：2

陈功罗森林陈开江冯扬潘丽敏《中文信息学报》2012,26(1):9-16

针对句法分析中上下文无关语法模型对句子信息利用的不足,通过融入结构下文和部分词汇信息,提出两种基于概率上下文无关语法模型的短语结构消歧方法,以达到消解结构歧义的目的;引入分层分析的算法,通过损失一定的时间效率使得在提高分析准确率的同时保证分析结果的全面性。实验结果表明,融入结构下文及词汇信息的汉语句法分析方法,利用了更多的句子信息,与上下文无关语法相比有着更强的消歧能力。相似文献