首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 227 毫秒
1.
机器翻译中句法分析的设计与实现   总被引:2,自引:0,他引:2  
费鲲 《计算机工程与设计》2006,27(15):2832-2834,2838
论述了英汉机器翻译中句法分析的设计与实现方法。首先阐述了编译原理中句法分析的相关理论,并以此理论为依据提出了机器翻译中句法分析的具体实现。实现过程中,采用部分分析的思想,将一个句子划分为多个语法成分,分别对各语法成分进行分析,从而完成对待翻译句子的句法分析,给出句法树。  相似文献   

2.
孙明勇  卢鹏  陆汝占 《计算机工程》2003,29(21):100-101,138
句法分析自动生成对提高自然语言处理程序开发效率有重要意义。文章提出支持复杂特征和合一文法的图算法句法分析器预自动生成方法,详述了规则描述、输出代码模式及生成过程中的主要算法,并实现了一个自动生成器。测试表明,在保证执行效率的同时,该自动生成方法可以很好地增加句法分析的可扩展性。  相似文献   

3.
本文根据汉语句法结构的特点, 提出了一种生成具有复杂特征集的多叉树的汉语句法分析方法。实现上, 提出了分阶段处理、部分人机对话、句法和语义知识并用等策略, 实现了一个初步实用的系统。本文最后给出了部分实验结果  相似文献   

4.
一种基于句法语义特征的汉语句法分析器   总被引:4,自引:2,他引:2  
句法分析不是简单地符号推理,而应该是一种实体推理。增加语义信息是实现句法分析实体推理的有效手段。本文所介绍的句法分析器有两个特色:一是利用基于词的兼类处理规则大大提高了句法分析的效率;二是利用词静态和动态的句法语义特征来限制句法规则过强的生成能力,取得了较好的效果。  相似文献   

5.
统计句法分析建模中基于信息论的特征类型分析   总被引:2,自引:0,他引:2  
统计句法分析利用概率评价模型评价每棵选句法树存在的可能性,选择概率值最高的候选句法树作为最终的句法分析结果。因此,统计句法分析的核心是一个概率评价模型,而各种概率评价模型的本质区别主要在于它们分别是根据上下文中的哪些特征来赋予句法树概率的。在统计句法分析研究领域,虽然已经提出了大量的概率评价模型,然而,不同的模型用得到了不同类型的特征,如何评价这些特征类型对于句法分析的作用呢?针对以上的问题,本研究为统计句法分析提出了一种特征类型的分析模型,该模型可以从信息论的角度量化地分析不同类型的上下文特征对于句法结构的预测作用。其基本思想是利用信息论中熵与条件熵的度量来显示一个特征类型是否抓住了预测句法结构的主要信息。如果加入某个特征类型之后当前句法结构的不确定性(熵)明显下降,则认为该特征类型抓住了上下文中影响句法结构的某些主要信息。特征类型分析的信息论模型利用预测信息量、预测信息增益、预测信息关联度以及预测信息总量四种度量从不同的仙量化地分析各种特征类型及特征类型组合对于当前目标的预测作用。实验以Penn TreeBank为训练集,将上下文中不同的特征类型对于句法分析规则的预测作用进行了系统的量化分析,得出了一系列有关不同特征类型及特征类型组合对句法结构的预测作用的结论。  相似文献   

6.
语义角色标注中特征优化组合研究   总被引:2,自引:0,他引:2  
特征决定着语义角色标注的性能,但并非特征越多性能越高.因此,如何优化组合这些特征就显得非常重要.选取了当前语义角色标注系统中常用的56个特征,按其贡献进行了优化组合实验.在正确的句法分析上取得了91.22%的语义角色分类精确率,在自动句法分析上语义角色标注F1值达到了78.07%.实验表明提高性能并不需要很多特征,关键在于特征的优化组合;同时在句法分析中起重要作用的谓词和中心词特征在语义角色标中也发挥了重要作用.  相似文献   

7.
目前,大部分句法分析都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出规则分层的方法,将标点融入汉语句法分析中。利用标点符号的分割作用,将长句分成一个个小的句子的序列,并对每个小的句子单元进行句法和结构分析,再根据已经抽取出来的类型规则进行二次句法分析,从而得到一个完整的句法分析树。实验表明,这种方法不但解决了部分长句无法正确得到句法树的难题,而且分析的歧义减小了,效率得到了提高。  相似文献   

8.
针对LDA主题模型用于产品特征抽取中存在的问题,提出将句法分析和主题模型相结合的SA-LDA方法。首先基于句法分析对产品所在类别下的所有产品评论进行分析抽取显式特征,并聚类产生特征集和观点集,据此构建语料库。接着对待分析产品的每条评论,提取主观句并利用改进LDA模型对其主题进行学习,根据语料库构建must-link和cannot-link约束条件,在主题更新时对其进行约束和引导,每个主题对应一个特征类。实验表明,本文方法对显式特征和隐式特征都具有很好的实验效果,且相比传统的方法和其他改进方法在保证召回率的同时对准确率也有一定程度的提高。   相似文献   

9.
描述了一个基于特征向量的语义角色标注系统,该系统以单一句法分析树作为输入。首先进行预处理,过滤掉极不可能是角色的成分,然后进行角色分类(包括NULL类),最后处理嵌套情况及对中心语义角色去重处理。在优化组合已有特征的基础上,从语法、句型以及搭配角度出发,制定了新的有效的特征;实验表明了新特征的有效性及健壮性。最终在CoNLL-2005 Shared Task开发集和WSJ测试集上分别获得了77.54%和78.75%的F1值,是目前已知的基于单一句法分析中取得的最好性能。  相似文献   

10.
问与答     
7.问:虽然我上大学时就开始用C语言,可是很少看到介绍一些预编译处理等方面的书籍。现对许多的预编译处理指令还是一点都不了解。不知你们有没有这方面的资料? 答:预处理控制行又称预处理命令,是C编译系统的一个组成部分。C语言提供的预处理功能主要有以下三种: (1)宏定义; (2)文件包含; (3)条件编译。  相似文献   

11.
特征提取是文本抄袭检测的重要环节,文本特征的数量和质量严重影响文本抄袭检测的准确率。针对现有方法的不足,提出一种基于依存句法的文本抄袭检测算法。该算法在依存句法分析的基础上,通过分析句子中词语间的关系以及合并短小词语建立句法框架,进而提取文本特征。其中,短小词语的合并能够使无意义词语合并成为有意义实体来表示文本特征,使文本特征更全面。实验结果表明,该文本特征提取算法能够准确选择文本的特征集,解决了文本特征数量多的问题,检测的准确率也有所提高。  相似文献   

12.
基于句法和语义信息的问句特征提取方法   总被引:1,自引:0,他引:1  
许莉  王大玲  夏秀峰 《计算机工程》2010,36(21):65-66,70
在分析当前中文问答系统中问句分析技术的基础上,提出一种基于句法结构和语义信息的问题特征提取方法。利用依存句法分析出问句的主干,从语义信息角度分析问句主干从而提取出问句的特征词,并用改进贝叶斯算法进行问题分类。实验证明,该特征提取方法能提高问题分类的准确性。  相似文献   

13.
数字化的建筑信息大量存在和应用于建筑设计、城市规划等领域。目前,由于建筑信息模型的数据量急剧膨胀,为克服“数据丰富而知识匮乏”现象,对其进行基于内容的模型分类十分必要。提出一种结合空间句法理论和基于SVM决策分类的模型分类方法,首先对建筑信息模型建立RCARG(Room Connectivity Attributed Relational Graphs)模型,提取出建筑信息模型的模型固有特征,并结合空间句法理论而扩充出模型空间构形特征,在常用的DAG-SVMS分类算法的基础上增加特征向量均衡化的过程,减少决策分类时误判几率,以实现高精准度分类效果。实验结果表明,该方法与KNN和DAG-SVMS算法相比,具有较高的分类精准度。  相似文献   

14.
在哈萨克语句法分析中,该文用平均感知器算法训练句法分析模型,用柱搜索算法进行解码,可以快速准确地对哈萨克语句子进行短语结构句法分析。在解析句子过程中,构建了一个双向LSTM模型,利用它提取句子中每个单词之间组成结构的信息,以预测每个单词在句法树中的句法组成部分,然后将结果作为辅助前瞻特征传递给句法分析过程。实验证明,此方法与基线模型相比,在准确率和召回率上均有提高。  相似文献   

15.
陈丰  余芸 《电子技术应用》2013,39(4):137-140
研究了常见的SQL注入检测和源代码静态分析扫描的原理,提出Java源代码SQL注入检测算法,该算法通过对Java源代码词法分析和语法分析、建立抽象语法树、定义规则、遍历语法树和跟踪等,检测Java源代码中可能的SQL注入路径,测试结果表明,算法检测效果良好,识别率高。  相似文献   

16.
为了检测程序设计类课程中出现的作业抄袭行为,提出了基于抽象语法树的抄袭检测方法.运用语法分析工具对代码进行语法分析生成抽象语法树(AST),通过计算生物学中序列匹配的算法进行程序相似度的计算.提取程序相似部分的AST特征,生成空间向量,聚类分析找出“抄袭团伙”.实验结果表明,该方法对抄袭行为具有较好的检测效果,并能比较准确地找到“抄袭团伙”.  相似文献   

17.
针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统.该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算法的句法分析模块.最后对系统进行小规模中文文本试验测试,测试结果表明利用改进的分析算法,使得句法分析效率和分析结果的准确率均有一定程度的提高.  相似文献   

18.
采用GLR算法对维吾尔语句子进行句法分析,并且与平行LR算法进行比较,比较它们的分析过程,针对于维吾尔语在单词集上进行句法分析。分析结果采用最优规则,选取最优的句法分析树,对下一步的句法分析研究提供很大的帮助。  相似文献   

19.
本文在句法分析树的基础上,着重考虑词与词之间的联系,提出了一种新的提取特征词方法--中心词关联法。最后,对该方法进行了实验。实验表明,采用中心词关联法大大地提高了排歧的正确率。  相似文献   

20.
Andy Litman 《Software》1993,23(3):341-350
Compilation time can be improved by precompiling interfaces so that the compiler can avoid processing unreferenced declarations. However, in C-based languages precompiling a header is difficult because a header can have several meanings depending on the context in which it is included. We present an ad hoc solution to this problem, and give the results of our precompilation strategy, which improved compile times by 25 to 65 per cent over compilation without precompiled headers.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号